File Management تGlفلlملا إدارة‎ 


الدرس الأول 


٠ مقدمة‎ 


لبناء نظم برمجية ناجحة وقوية نحتاج لفهم كيفية بناء البيانات وتخزينها والوصول اليها ومعالجتها بصورة 
فعالة وبالكفاءة المطلوبة. 
تهتم مادة ادارة الملفات بدراسة طرق تنظيم و تخزين البيانات وكذلك دراسة وسائط التخزين المخئلفة 
وخصائص ومميزات كل نوع وطريقة استخدامه . 
وبا أن البيائات ثحفظ في صورة ملفات فان هذه المادة نهم ايضا بتنظيم هذه الملفات داخلياً حيبت نى 
بتركيبها وبنيتها وطرق الوصول الى محتوياتها وطرق البحث والفهرسة مما يؤدي لخلق أنواع عديدة من 
الملفات . 
أما تنظيمها خارجيا فيعني وضع كل نوع في وسط التخزين المناسب له . ولأن سرعة الوصول الى البيانات 
الموجودة بالقرص او الذاكرة الثانوية تعتبر أكثر بطئاً من سرعة الوصول الى البيانات في الذاكرة الرئيسية 
نك أن هادة اذارة ر تنظ الملفات ك نضا كفة تحضين سر هة الرض رل الى اباك ٠‏ 
ويمكننا أن نجمل أهداف إدارة وتنظيم الملفات في الآتي : 
ای الول ال ا ا اکل ا 
-2 الإستخدام الأمثل لوسائط التخزين الخارجي . 
-3سهولة عملية التخزين للبيانات . 
مقدمة عن وسائط التخزين الفيزيائية 
Overview of physical storage media‏ 
یتم تخزين انات فو افا في وسيط تخزين 1611۳ S0۲8٥‏ حتى تتمكن البرامج من التعامل مع 
هذه البيانات بالإسترجاع والتعديل» وعموماً يرتكز تصنيف وسائط التخزين على ثلاث عوامل أساسية : 
a A AE SE E‏ 
The speed of which data can be accessed‏ 
-2 التكلفة 
the cost per unit of data to buy the medium‏ 
-3الإعتمادية او العمر الافتراضي the medium’s reliability‏ . 


وسائط التخزين هذه يمكن تقسيمها لنوعين أساسين هما : 
1.وسائط التخزين الأولية prİmary S(0rage‏ :- 


وهي تشمل وسائط التخزين التي تتعامل مباشرة مع المعالج مثل الذاكرة الرئيسية Main Men01ry‏ 
وال Cache Memo,‏ وهذه الوسائط تمتاز بسرعتها العالية ولكن حجمها صغير مقارنة بالذاكرة 
الثانوية . 

2.وسائط التخزين الثانوية §ecOndary S0rage‏ :- 
وهذا النو ع يضم الأقراص الممغنطة Magnetic ¡sks‏ والأقر اص الضوئية optical Disk‏ 
والأشرطة الممغنطة كعمه1 عنامرعة1× وتمتاز بسعاتها التخزينية الكبيرة وتكلفتها القليلة نسبيا › 
ولكن سرعتها بطيئة مقارنة بالوسائط الأولية. 
اناف رة را اكرون اا ون اها ن ا مها ما د وکن بخ ا ان کن 
إلى وسيط التخزين الأولى . 


Types of storage ¢edia أنواع الذاكرة ووسائط التخزين‎ 

يمكن تنظيم أنواع وسائط التخزين المختلفة في شكل هرمي بناء على سرعتها وتكلفتها وكلما انحدرنا 
من قمة الهرم إلى اسفل تقل السرعة والتكلفة. 
ال Primary Storage‏ وهي اسرع أنواع وسائط التخزين - مثJ Main Jiy cache —JI‏ 
eM01¥‏ - وتوجد في قمة الهرم . وفي المستوى الثاني من الهرم توجد ال 141¥ sec0‏ 
storage‏ مثل ال Magnetic disks‏ وفي ادنی مستوى من الهرم تات Tertiary Jl‏ 
optical disk jukebox Epps—Jls, magnetic tape Jîn storage‏ . 


Flash memory 
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Optical Disk 


Magnetic Tape 


Figure (1) : Storage device hierarchy 


بالإضافة لسرعة وتكلفة وسائط التخزين يوجد عامل إضافي هام وهو هل الذاكرة او وسط التخزين متطاير ام 
غير متطاير or Nonvoا]a)11e S04‏ eاatiاvo‏ . والذاكرة المتطايرة تعنى أنها ذاكرة مؤقتة تفقد 


محتوياتها بمجرد انقطاع التيار الكهربي عنها ولحفظ البيانات يجب ان تكون الذاكرة Nonvo1at1[e‏ 
t8‏ بالرجوع الي الشكل الهرمي (1) : من الذاكرة الرئيسية رإمصإM‏ 1ة" والى اعلى 
عبارة عن S0]2ge؟‏ ع]Nonvolati1‏ اما الانواع التي تقع اسفJ Main Memory Jl‏ جيعھا 
Nonvolatile Storage‏ . 
وحدات قياس التخزين المختلفة في الحاسوب : 
byte = 8 bits‏ 1 
k (kilo byte) = 1000 bytes =10‏ 1 
M (mega byte) = 1 million bytes = 10°‏ 1 
G (Giga byte ) = 1 billion bytes 10‏ 1 
T (Tera byte ) = 1000 Giga byte = 10”‏ 1 


رسكارل راع ساط التكرين بشي من االتفضل تدا من ابر عها واغدها وهي ا 8ط6ة) وکت 
أقلها تكلفة وأبطأها وهي Magnetic Tape —Jl‏ . 
Cache Memory 1-‏ : هي أسرع واغلى وسائط التخزين الأولية وهي عبارة عن Static R ^M‏ 
تستخدمها ال K۴‏ لزيادة سرعة تنفيذ البرامج . وتتم إدارة ال C4٥18‏ وتنظيمها بو اسطة 
نظام التشغيل نفسه . 
Main Memory 2-‏ : تمثل منطقة العمل الرئيسية للمعالج التي يحتفظ فيها بالبيانات والبرامج العاملة 
حاليا وهي عبlرة Dynamic RAM jz‏ . 
ميزتها الأساسية سعرها قليل نسبياً مقارنة مع ال ٥2٥10‏ حيث نلاحظ ان سعرها متناقص. أما عيبها 
الأساسي فهو أنها متطاير ة 72017 Me‏ م11)هاه۷ . وايضا بطأها نسبيا مقارنة بال عhطء2ھ€‏ . 
3-Flash Memory‏ : تعر ıiضÎ‏ ب ) EEPROM‏ ( 
Electrically Erasable programmable Read Only Memory‏ 
وهي نوع وسط بين القرص والذاكرة الرئيسية تختلف عن الذاكرة الرئيسية "21١ M1017‏ في انها 
غير متطايرة ٥[1)ة[اه‏ ا٣٥‏ . وهي الاسرع في استرجاع البيانات مقارنة Main Memory dJ‏ لکن 
عملية الكتابة واعادة الكتابة بها تعتبر الاكثر تعقيدا. ولاعادة الکتابة بھا یجب مسح کل ال 81٥e)‏ أولاً ثم 
بعد ذلك الكتابة من جديد ويكمن العيب الأساسي لل M10۲۷‏ ه۴1 في أنها لا تتيح مسح إلا أجزاء 
محدودة منها . 
وتعتبر ال إMemO1 ۴1ash‏ هي الأكثر استخداما بدلا عن القرص في أنظمة الكمبيوتر الصغيرة 
المضمنة في العديد من الأجهزة والتي لا تتطلب وسائط تخزين كبيرة جدا . 
4-M ag netic Storage‏ : الاقراص المغنطيسية تستخدم لحفظ كميات البيانات الكبيرة وتعتبر هي 
الوسيط الاساسي لتخزين البيانات لفترات طويلة 01۸11۸٥ S0۲2٥‏ ۲۳ع 018 [وحجم القرص يحدد 
بسعته بال 6ر8 ملا القرص المرن یا¡ رممه۴1 سعته 1.4 M8‏ والقرص الصلب Had‏ 
1s)‏ سعاته في تز اید مستمر وتتراوح الان من بين بضعة كە إ8 M‏ الى عشرات ال ع)yر6.B‏ . 
لمعالجة البيانات يتم نقلها أولاً من القرص الى الذاكرة الرئيسية وبعد المعالجة تعاد اليه ثانية ليتم حفظها فيه . 


ويطلق على الاقراص المغناطيسية 50۲38٥‏ 8؟عء٥4-‏ ا٥1۲6‏ لأن الوصول للبيانات الموجودة على 
القرص يتم مباشرة دون المرور على البيانات الموجودة قبلها . 
وتمتاز الاقراص المغناطيسية بانها غير متطايرة 01۷01411٥‏ وتحنفظ ببياناتها رغم انقطاع التيار عنها 
أ مطل التظام رزتانا ماتضاب الأقرأضن بأغطال جسمة تؤدي الى تدمير الات و ضاعها: 
Disk (CD-ROM) Compact Disk Read J Îz gı la isl : 5-Optical Storage‏ 
Memory‏ yآ0n‏ تخزن فيها البيانات بطريقة يستخدم فيها الضوء (yآاةء!امه)‏ وتقرأً بواسطة الليزر 
وهي تحتوي علي بيانات مكتوبة لايمکن مسحھا lذI‏ تمي WORM) Write once Read Many)‏ 
وتستخدم كوسيط لتخزين بيانات الأرشفة 24( 0 عع۲4١S0 A۲1۷21‏ وتسمح بكتابة البيانات مرة 
واحدة فقط وقراءتها عدد من المرات دون اعرضها للمسح . 

وال Optica jukebox Memories‏ عبارة عن منظومة من C0-۸0١8‏ تحمل على ال 
۷ عند الطلب سعتها كبيرة حيٿث تسع مئات ال 68S‏ ولكنھا ابطÎ Magnetic Disk —JI ja‏ « 
هذا النوع لم ينتشر كثوا نسبة لزيادة القرص الصلب وقلة سعره المضطرد . 

أا ا D۷ D( Digital Video Disks)‏ فهو نوع جديد من الاقراص الضوئية )ءال 1ca1امpه‏ 
تصل سعته الى 15 ٥8‏ . 
"Ape Stor g€.6‏ : تستخدم ال Magnetic Tape‏ نسبة لانها تمتاز بقلة التكلفة مقارنة بالاقراص 
المغناطيسية وامكانية تخزينها لكميات كبيرة من البيانات قد تصل لعدد من ال ك؟ع)ر8 1٥۲4‏ استخدامها 
الأساسي لحفظ نسخ احتياطية ال صا )ء84 ولحفظ وأرشفة البيانات Archival Data —l‏ 
ويكمن عيبها الرئيسي في بطئها الشديد فهي عبارة عن 80128 -A ce‏ [ھ1امع۹uمS‏ بمعنی أنه 
للوصول لبيانات محددة محفوظة بالشريط يجب المرور على جميع البيانات التي تسبقها تسلسلياً من بداية 
الشريط وحتى الوصول اليها . وعموما فإن سعات وسائط التخزين المختلفة في زيادة وأسعارها في نقصان . 


يجب تخزين وحفظ قو اعد البيانات Sكعء24طاه)ة(‏ بصورة دائمة في إحدى وسائط التخزين الثانوية وذلك 
للآتي : 
1.البيانات قد تكون كثيرة بحيث لاتسعها الذاكرة الرئيسية . 
2. احتمال ضياع البيانات في الذاكرة الرئيسية $0۲4e‏ ء[1ه[ه ۷ أكبر من احتمال ضياعها من 
القرص. 
3.تكلفة التخزين في الوسيط الثانوي أقل من تكلفة التخزين في الذاكرة الرئيسية . 
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1.ما هي الفروقات بين طرق التخزين الأولية ع50۲۵ ۴۲1٣١۵۲۷‏ وطرق التخزين الثانوية ؟ 
Storage‏ Secondary؟‏ 

2.علل لايمكننا تخزين قواعد البيانات الكبيرة جا في الذاكرة الرئيسية ؟ 


الدرس الثاني 


الأقرإص nllخliطıuıة Magnetic Disks‏ : 
رشقر ار اصن اة ت ال اصن اة 566 74و1 = اك الوسافط الاه ة 
استخداماً في الحاسبات . حيث ان البيانات بها تكون متاحة 01-1108 مقارنة بوسائط التخزين الثانوية 
الاخرى والتي تكون 0۴۴-11١8‏ بمعنى انها تكون غير جاهزة وتحتاج لعمل يدوي أو ميكانيكي لتوصيلها 
بالنظام .لذا سنتناول الأقراص بشيء من التفصيل : 
خصائص الأقراص llلlıjıئıة physical Characteristics of Disks)‏ ( : 
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يتكون القرص من مجموعة ال ٣1)١١‏ وهي شرائح مغناطيسية دائرية رقيقة مصنوعة من مادة صلبة 
كما في الاقراص الصلبة كksیا‏ ۳14۲4 أو تكون مصنوعة من مادة بلاستيكية كما في الاقراص المرنة 
Floppy Disks‏ . 
يتم تخزين البيانات على أسطح هذه الشرائح فاذا كان التخزين على وجه واحد فقط من وجهي الشريحة يطلق 
على القرص ءال S1ng1e S1ded‏ بینما ال Double Sided Dis)‏ یتیج امکانية التخزين على 
وجهي الشريحة . 
بالنسبة للقرص الصلب توجد منظومة من الشرائح ۴۵٥)‏ ء1 تضم عدة شرائح يقسم كل سطح من هذه 
الشرائح منطقياً الى مجموعة من المسارات الدائرية Sءاءه1۲‏ هذه المسارات بدورها تنقسم الى وحدات 
صغير ة ٿمJ Sectors or Blocks)‏ ( . 

اعتمادا على نوع القرص تختلف احجام ال كإهاء٥S‏ وعدد المسارات كkعهة1۲‏ في الشريحة من 
قرص الى آخر . وغالباً مايتراوح عدد ال ؟)٥ 1٣۵‏ بين مئات او الى عدة الاف من ال 1۲۵٥)S‏ في 
الشريحة الواحدة بينما يتم تقسيم المسار ۲4٥)‏ الى عدد من ال ؟0۲٥$6‏ بواسطة نظام التشغيل أثثاء 
تهيئة القرص ۴0۲٣۵) ٥E‏ لذا فان حجم ال $٥٥٥١‏ ثابت ولايمكن تغييره وغالباً مايتراوح ال 
Sector‏ الواحد بین 32 K8‏ الی 4096 K8‏ . جدیر بالذکر أن هذہ ال S٥0۲۶‏ تفصل عن 
بعضها بمساحات محددة (فراغات) تسمي ب (ءم4ع )ء0[ط۲ء)د] ) هذه المساحات تضم بيانات تحكم 
خاصة تكتب بها أثناء عملية التهيئة ال 11114112410١1‏ هذه البيانات تستخدم لتحديد موضع ال 
Track „i Sector‏ . 
وعموماً هنالك تحسن كبير في صناعة الأقراص الصلبة من ناحية السعة التخزينية ومن ناحية السرعة في 
استرجاع البيانات أن أسعارها في انخفاض مستمر . 

#الحركة الميكانيكية : 

الوحدة الآلية الحقيقية التي تقوم بالقراءة والكتابة هي رأس القراءة والکتابö Read/Write head‏ . 
حيث يوجد راس قراءة وكتابة على سطح ال ١14م‏ وهو الذي يقوم بتسجيل البياتات بطريقة مغنطيسية 
في Sector‏ محدد . 
لأي وجه من وجهي ال-١6)٤۴14‏ رأس قراءة وكتابة يتحرك على سطح ۴16۲ للوصول لل 
6" المختلفة . 
يضم القرص العديد من ال ١١٥))ه۴1‏ وبالتالي العديد من رؤوس القراءة والكتابة مثبتة على مجمع رؤوس 
واحد یعرف ب ۸۲۳ ء1 وهي بدورها مثبتة على حامل يسمی 800۳ يتحكم في حركته محرك 
M001‏ يتحرك في اتجاه أفقي حتى يتم وضع الرؤوس على ال ك)٤۲4]‏ المحددة فعند حركة أحد 
الرؤوس الاخرى للوصول لل ه۲ رقم ([1) الموجود في جميع ال ۲5اه[ الاخرى. كل ال 
trae‏ رقم 1 في جمیع ال ۶٣ع‏ )ھام تعرف ب ا1inderاCy‏ رقم )1( 

منظومة الشرائح (١١إع))هآم‏ ) ال عم" D1sk‏ مثبتة على محور عال٣1م8‏ ويحتوي ال )ء51 

م۷ على محرك [1010١‏ يحرك هذه الشرائح حركة دائرية حول محورها . يطلق على النوع السابق 
من انواع الاقراص الصلبة Movable head disks‏ . 


هنالك أنواع من الاقراص لها رؤوس ثابتة وبعدد ال ء٤٥1۲۵‏ ( راس لكل 1٣۵٥)‏ )» حيث يكون 
بالذراع ۸۲۳ الواحدة رؤوس وبعدد ال ء)عه]] على السطح الواحد. هذا النوع يعرف بمصطلح 
۴1xe4-he2d disk‏ في هذا النوع من الاقراص يتم تحديد ال )عهع) أو إع1indارC‏ بواسطة 
نظام مفتاح الکتروني [٥٥٤۲٥0۸1٥ $؟W 1٥1118‏ يحدد الراس المطلوب والمقابل لل )عھ]ا] المحدد 
الكترونيات بدلا من حركة ميكانيكية حقيقية ونتيجة لهذا يعتبر هذا النوع أسرع كثوا من الأول ولكن نسبة 
للعدد الزائد من الرؤوس فتكلفته أعلى . 

وكذلك يوجد نوع آخر من انواع الاقراص به اکثر من ۸۲۳ ء1 واحد في نفس ال ںPlatte‏ 
يتيح الوصول لاكثر من 1۲4٥)‏ واحد في نفس الزمن . 
هذا النو ع من الأقراص ال(Kءال‏ 24ط ۴×٥4‏ ) غير شائع ويستخدم فقط في High — Jl‏ 
performance mainframe systems‏ . 

: Disk Controllere 


System Bus 


Disk controller 


هذه الوحدة تعتبر جزء من كك1 ء1 وهي تحكم فيه وتشكل الواجهة 110۲۴4٥8‏ بينه وبين 
نظام الكمبيوتر . واحدى انواع الواجهات 116۲۴٥8‏ القياسية والمستخدمة حاليا مع الحاسبات الشخصيه 
ٿıمJ‏ ب— SCSI (small computer storage interface‏ ( 
تتلقى ال ۲٥[1ه٣٤ره€‏ أوامر القراءة والكتابة المكتوبة بلغات المستوى العالي لتتخذ بناء عليها الحركة 
المناسبة لوضع الذراع ال ۸۲١‏ وبالتالي وضع راس القراءة والكتابة في الموضع المطلوب لحدوث عملية 
القراءة او الكتابة . 

كذلك تقوم ال 0)٣0]‏ بإلحاق وحدة تمى ¬1 Checks‏ بکل إtorاcعS‏ یتم كتابة عدد البیانات 
المخونة بها 

وعند قراءة هذه البيانات يتم حساب حجم البيانات التي تمت قراءتها ويقارن هذا الحجم بقيمة ال 
Checksum‏ المخزنة في كل ١0ء٥8‏ فاذا لم تتطابق القيمتان فان هناك خطاً 8۲0۲ » في هذه الحالة 
تكرر ال ۲ع ]11ه٣اnهC‏ المحاولة عدة مرات » فاذا إستمر الخطاً في الحدوث تتبه ال ]01۲0ء نظام 
التشغيل الى وجود مشكلة في عملية القراءة ٥۲ں‏ ]۴21 Read‏ . 


#العنونة ونقل البيانات : 
عند نقل البيانات من أو الى القرص يتم التعامل بوحدة تسمى ال )ء810 )ء1 وهو يمكن ان يكون 
Sect‏ واحد أو مجموعة من ال ك0۲)٥ع$‏ المتتالية في نفس 1۲۵٥)‏ حيث يتم تحديد عنوان ال 
ڄء0اB‏ في القرص والوصول اليه مباشرة. وعنوان ال )ع810 يتكون من رقم السطح ال إًPlatte‏ 
> رقم المسار ال )ها1 (داخل السطح) › ورقم ال 810e)‏ (داخل ال (Track‏ . 
وتقوم وحدة W 2۲۴١‏ ۳13۲0 1/0 الموجودة بالقرص نفسه بتحديد هذا العنوان . 
ذاكرة ال 8uf]٥۲‏ الخاصة بالقرص عبارة عن جزء من الذاكرة الرئيسية يتم نقل البيانات بينها وبين 
القرص فعند عملية القراءة يتم نقل البيانات بينها وبين القرص . فعند عملية القراءة يتم نسخ البيانات من ال 
Block‏ الى ال Buf f٥۲‏ وعند الكتابة یتم نقل محتویات ال ۶۲ا8 الى القرص الصلب . احيانا 
يتم نقل البيانات في شكل مجموعة من ال ع810 كوحدة واحدة تسمى ال ١عئلاآ€‏ في هذه الحالة 
يجب زيادة حجم ال ؟ Buf]‏ حتى تسع Cluster | J‏ . 
تنتقل البيانات بين القرص والذاكرة الرئيسية في شكل ء8[0›)s‏ ويaوم File System Manager —lI‏ 
بتحويل عنوان ا Block Jl, Track Jl, Cylinder JI, Platter —JI مةرi Block‏ 
المطلوب التعامل معه . 
مقاييس اء الأقراص Performance Measure of Disks)‏ ( : 
المقاييس الأساسية لاداء القرص هي : 
1.Capacity 2.Access Time‏ 
3.Data Transfer Rate 4.Reliability‏ 


Capacity .1‏ : السعة 

ونجد أن الحاسبات الحديثة توفر سعات تخزينية ضخمة تتيح تخزين كميات كبيرة من البيانات . 
Access r] ime 2.‏ زمن الوصول للبیانات: 

هو الزمن المطلوب لتحديد موضع ال )ء810 المطلوب قراءته أو الكتابة به لتبدئ عملية نقل 
البيانات بين القرص والذاكرة الرئيسية ويتكون من :- 

s( Seek T1 €()(‏ زمن البحث 

هو الزمن المطلوب لتحريك رأس القراءة والكتابة الى ال ع1۲4 المطلوب في ال Movable —head‏ 
)نل أما في ال )يذل 24عط- d#ه×۴1‏ فهو الزمن المستغرق لتحديد الراس المطلوب الكترونياً ‏ 
Movable-head disks —JI „Jè {Electronically switch to the appropriate head‏ 
يختلف هذا الزمن على حسب موضع الراس الحالي والموضع المطلوب الانتقال اليه وعادة ماتحدد الشركات 
المصنعة هذا الزمن کمتوسط ع۲1۳ )ععء ع ۲ء۸۷ بالملى ثانيه وهو عادة مايتراوح بين 60-10 
٥ع‏ في الحاسبات الشخصية ومن 9٤٥٥-8‏ في اجهزة ال ۲۶٥S©۲۷؟‏ . 


: rd) Rotational Delay (or latency) Time) (b) 


عندما يكون راس القراءة والكتابة في ال عه]] المطلوب يجب الانتظار حتى تدور ال 
"1tt‏ لتصل لبداية ال ء81 المطلوب أسفل الراس هذذ الزمن يمكن ان يكون صفر اذا كان ال 
)عاB‏ المطلوب تحت الراس بمجرج وصول الراس لل )ه1۲4 المعنى أو يمكن أن يكون زمن دورة 
کاملة لل ٣ع]٤‏ ه۴1 اذا كان ال المطلوب هو ال 810٥)‏ قبل ال 81٥٥)‏ الموجود حالياً تحت 
الاس : 
اما بالنسبة لل )ءال he2‏ dع۴1x‏ يعتبر الع"٠‏ 11 kعع؟8‏ صغير لذا تكون ال ۲۵ هي القيمه 
المؤثرة على سرعة القراءة والكتابة . اذا ال Access {1٣€‏ ھو مجمو ع seek time +d dl‏ 
:Block Transfer Rate yi (Data Transfer Rate (Tr .3‏ 
هو معدل نقل البيانات من والى القرص بعد وصول الراس لبداية ال )ء810 المطلوب نقله. هناك زمن 
مطلوب لنقل البيانات من ال عء8[0 الى الذاكرة الرئيسية وزمن نJa Block Transfer time )) —J|‏ 
)btt( Block)‏ يعتمد على حجم ال )ء81 وحجم ال )ه1۲ وسرعة دوران القرص . وبھذا يكون 
الزمن الكلي المطلوب لتحديد موضع ال ء810 ونقل محتواه هو مجموع : 
Seek time Rotational delay +Block transfer rate‏ 
ا 
قرص صلب معدل نقل بیاناته يساوي 10 ۵٥‏ ۳ وزمن البحثٹ ع٥٣1‏ kععء‏ هو 5 ٤ع‏ ص إذا 
علمت أن قيمة ال عصص1ا راع اج«مناهاهR‏ هي صفر »احسب الزمن اللازم للوصول الي )10ط 
ونقل محتواه ؟ 
ا 
Access time = Seek time +Rotational delay +Block transfer rate‏ 
m sec ٍ‏ 15 =5+0+10 = 
وعموما Rotational delay —JI, Seek 1T 1me ll‏ ıinjھnا‏ ابر Block Transfer I ja‏ 
Rate‏ حیث أن الزمن الاكبر للحركة الميكانيكية » لذا ولزيادة كفاءة وسرعة نقل البيانات توضع ال 
gع0اB‏ التي يراد التعامل معها (قراءة او كتابة ) في اسطوانة واحدة إ6 ل ,ا٣‏ لتقليل الحركة 
الميكانيكية . وعلى كل حال يعتبر الزمن المطلوب للوصول الى هذه البيانات المحددة على القرص كبيرا 
مقارنة بومن تشغيلها في ال Main M€M01¥‏ . 


Reliability .4‏ الإعتمادية: - 
يتم قياس ال را1 11ط1aاRe‏ لقرص بمتوسط زمن تعطله عن العمل mean time of failure is a)‏ 
measure of rellabılity of the disk‏ ) وهو متوسط الفترة الزمنية التي يتوقع ان يعمل فيها 
القرص باستمرار دون توقف( متوسط زمن السقوط) . 
ا 
آرت كل من المففطلحات اة هة 
block 2-cylinder 3-sector  4-1nterblockgap‏ -1 


5- Cluster 
2.بإختصار أذكر الطريقة الميكانيكية التي تتم بها قراءة البيانات من القرص الصلب ؟‎ 
3.ماذا نعني بمتوسط زمن السقوط ؟‎ 
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الدرس الثالث 
RAID Technology‏ 


مع زيادة احجام وسرعات الذاكرة الرئيسية والمعالجات كان لابد من زيادة احجام وسرعات وحدات 
التخزين الثانوية لمقابلة هذه الزيادة » ولمقابلة احتياجات التطبيقات الجديدة وكان من اميز التطورات في 
وحدات التخزين الثانوية ال R۸41[5‏ 
:RAID) Redundant Arrays of Inexpensive Disk)‏ 
الحرف [ احيانا يرمز لل ٤رعdمعمعلم]‏ كان السبب الاساسي للتفكير في ال ۸۸12 هو أن الزيادة 


في تحسين أداء ال ك1( لم يكن بنفس سرعة الزيادة في تحسين اداء الذاكرة والمعالج . فكان الحل إنشاء 

منظومة (إA۲۲۵‏ ) من الاقراص المفصولة عن بعضها لتعمل كلها كقرص (منطقي) واحد ليكون عالي 

الكفاءة باستعمال مفهوم 5۲1118 044 والذي يحقق مفهوم العمل على التوازي e115٥١‏ ]2۲1م . 
عملية ال S۲111‏ ها2 هي عبارة عن توزيع البيانات على الاقراص لتعمل كلها كقرص واحد 


وسريع . الشكل التالي يوضح كيفية توزيع البيانات لملف واحد وعلى عدد 4 اقراص . 


Figure (4) : Data stripping : file A is striped across 4 disk 


عملية توزيع البيانات 5۲11١18‏ 44 تعمل على تحسين الاداء الكلي بالاتي : 
1.تتيح لاكثر من عملية 1/ع 1م1٤‏ الاد 0© (قراءة او كتابة ) ان تعمل على التوازي مما يحسن عملية نقل 
البيانات ع۲4 إ#6كصه۲) الكلي . 
2. يقوم ال ([۸4۸ بتوزيع العمل على كل ال كیا . 
3. يمكن تحسين الاعتمادية ۲٥112111۷‏ بتكرار كتابة البيانات على اقراص مختلفة. 


تحسين الإعتمادية باستخدام :RAID Improving Reliability with RAID JI‏ 
باستعمال منظومة أقراص ء)ء1( مكونة من 1 قرص احتمال العطل 1 مرة احتمال تعطل القرص الواحد . 
فمثلا لمنظومة مكونة من 100 قرص أذا كان العمر الافتراضي للقرص 200.000 ساعة أي 22.8 سنة .. 
يكون العمر الافتراضي للمتظومة فقط 2000 ساعة أي 83.3 يوم وبفرض ان هناك نسخة واحدة من 
البيانات مقسمة على كل الأقراص. 
اذا الحل هو كتابة نسخة إضافية من البيانات ولكن عيب هذا الحل هو المساحة الإضافية المطلوبة لهذه النسخة 
إضافة للعمليات الإضافية(0/]) اللازمة لكتابة البيانات اكثر من مرة . 
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اذا فالتقنية الشائعة هي ال 11€ Mirroring o۲ Shadow‏ حیث تكتب البيانات في قرصین متطابقین في 
نفس الوقت واللذان يعاملان منطقيا كقرص منطقي واحد. عند قراءة البيانات تقرأً من أسرع القرصين .. 
وعند تعطل أحدهما تقرأً من الآخر حتى يتم إصلاح الأول . 
تحسين الأداء بإستخدIم :RAID RAID in Improving Performance I‏ 
توزيع البيانات على منظومة الاقراص يزيد من سرعة نقل البيانات . وبما ان البيانات تقرأً بو اقع )10ط 
واحد في اللحظة فانه يمكن تطبيق ال ع٣‏ 1م۲1اك )آل لادنى مستوى بتقسيم ال عالط الى 8 ثنائيات ( 
6 وتوزيع هذه ال كا1ط على 8 اقراص مختلفة حيث يكتب ال 01 رقم إ في القرص رقم [ وبهذه تزيد 
كمية البيانات المقرؤة في اللحظة gع11ضsri bit -level data‏ . 
ويمكن تطبيق ال 1111ء ههل على مستوى اعلى من ال 018 حيث يمكن تقسيم الملف الى 
0cksاb‏ وکل )عاط يکتب في قرص منفصل ع۲111 [٥۷٥1‏ )1ط بهذه الحالة يمكن الوصول 
الى )ء810 مختلفة في نفس اللحظة مما يزيد كفاءة زمن الوصول الى البيانات عموما كلما زاد عدد 
الاقراص زادت كفاءة المنظومة وايضا زاد احتمال حدوث العطل وبالتالي زادت الحوجة الى ¡۲٣0۲104‏ . 
RAID Organization and Levels‏ : 
تقسم ال ۸4۸12 من ناحية تنظيمية الى انواع او مستويات ١[ع‏ ۷ع[ يعتمد هذا التصنيف على عاملين 
اساسين وهما :- 
Granularity of data striping *‏ 
.Pattern used to compute redundant information *‏ 
في البداية كان التصنيف من المستوى الاول الى الخامس 1 1۴۷٥1‏ وحتى 5 [۴۷٥1‏ ومؤخرا اضيفت 
level 0 ; level 6‏ . 
1۷0 : البيانات لا تتكرر ولهذا سرعة الكتابة وتعديل البيانات عالية لان البيانات لاتكتب مرتين . اما 
سرعة القراءة فهي اقل مما عليه في المستوى 1 [ع ۷ع[ حيت تكتب البيانات مكررة لانها تستعمل نقنيه 
كال ٠ irre‏ حيث تكون في الاخيرة سرعة القراءة عالية وبحيث يتم تحسين الاداء بجدولة عمليات 
القراءة ويتم تنفيذ العملية التي تتطلب زمن بحث اقل . 
L۷61 2‏ : تستعمل مایسمی بال redundancy‏ eاsty-memory‏ والتي توفر 1s‏ yا1ا‏ 2م وبهذا 
فهي تحتاج لتثلاث اقراص اضافيه ءال und 2٣٤‏ لعا ععاhط)‏ لكل اربعة اقراص اصليةء مقارنة باربعة 
اقراص مقابل اربعة اصلية في 1 1٥۷٥1‏ وهي ايضا تتيح امكانية اكتشاف وتعدیل الخطأً ۲۲0۲© 
detection and correction‏ . 
3ع: تستعمل قرص واحد لتخزين ال 4۲1۷م واربعة اقراص لتخزين البيانات معتمدة على ال 
contre‏ لتحديد أي الاقراص قد تعطل . 
5 evelا‏ , 4 Level]‏ : تستعمل ال ګ٣1مst۲1p data‏ eve1ا‏ ockاb‏ وفي 5 [۴۷٥1‏ توزع البیانات 
وال nform2)101ا party‏ عبر کل الاقراص . 
[e۷61 6‏ : تطبق مایسمی بال PQ edu n d2٬ ٤y‏ »۰ حیث توجد 
2bıit for redundant data are store for every 4 bits of data)‏ (. 
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مما سبق من مقارنة يتضح ان اعادة بناء البيانات اسهل في 1 1ء۴۷[ في حالة تعطل أي قرص .. اما في 
بقية المستويات فهي تحتاج الى عملية معقدة والقراءة من كل الاقراص الاخرى . ولهذا فان 1 1ء1۷ 
يستعمل في التطبيقات المهمة والحرجة مJ‏ >فظ level 3 ş level 5 Ll log of transactions‏ 

فهي تستعمل في البيانات كبيرة الحجم حيث تقدم [۴۷٥13‏ سرعة عالية لنقل البيانات . 

اذا مصممي ال ۸412 يجب ان يضعوا في الحسبان العديد من العوامل : مثل ال ۷1ا R412‏ و 
عدد الاقراص المطلوبة » طريقة ال ,1٣2م‏ المستعملة . 

بمناقشة ال رعهآام«طءء1 R410‏ يتضح لنا التقدم في مجال تخزين البيانات وكيفية توظيف الافكار 
نفسها يكون حسب التطبيقات . 


E 


ت سے - سر 


ننن ےه 


Merury-Style ECC (RAG Level 2} 


SOS 


Bt-Irterlsaved Parily {RAID Level 23 


EB. E 
. 
س‎ E 


P+ Radundangy (RAID Level 6} 


Figure 3.4 Multiple levels of HAIL From Chen, Lee, Gibscn, Kale, aud Fatrersar 
(1994, ACM Computing Surry, Val. 2f, Na. ã June 13424. 
Reprirted wirh permisscn. 


Buffering of Blocks 
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اذا كان هناك العديد من ال ء)ءه[8 يراد نقلها من القرص الى الذاكرة الرئيسية وكلها معروفة العناوين. 
يمكن حجز اكثر من موضع في الذاكرة ١إ٥٤f‏ اط 5٥۷٥۲21‏ لزيادة سرعة نقل البيانات يستخدام ال 
٣اط‏ كوسيط بين الذاكرة والقرص عند عملية نقل البيانات .اثناء قراءة او كتابة u ۴٤٤٣‏ طا ٥1€‏ يمكن 
للمعالج ان یشغل ۲٥گداط‏ اخری . وهذا یمکن بوجود p]0٥8880۲(‏ 1/0 )ین او ۲ما1اەcontr‏ والذي 
يعمل على التوازي وبمنعزل من ال ل۴ . الشكل (6) يوضح كيف يمكن لمعالجين ان يعملان على 
التوازي العملیتان ۸,8 تعملان على التوالي ولكن بصورة ٩٥۵۷ع[ ]"٥۲‏ بينما C,2‏ تعملان على 

(in a paralle1 fash101) التو از ي‎ 


Interleaved concurrency of 1 
Parallel Execution of operations 


operations A & B 
C&D 
a a 
۰ : ۰ CC ا‎ 
: ۰ 1B س‎ 
: إ‎ B : ب‎ 
T1 T2 T3 T4 Time 


في حالة تحكم ال C۴‏ على عدة عمليات يكون التشغيل على التوازي 1)101۸٤ع×ع‏ آع[[ة2۲م غير 
ممكنا . ولكن يمكن لتلك العمليات ان تعالج رمس Q٥ع4۷ء‏ ]۲٥ا1 ٠» 1١ ۵١‏ وفي حالة تشغيل العمليات 
على التوازي 110۸ھ 1ءااجa۲م‏ ۾ 1۸ تكون عملية ال ع١1١٥]‏ اط مفيدة جدا اما لوجود معالج 
القرص الخاص (0ces80۲!ضp‏ 1/0 controller) disk‏ او لوجود eدö CPU‏ . 

الشكل يوضح كيف يمكن لعمليتي القراة والمعالجة ان تعملان على التوازي عندما يكون زمن معالجة ال 
kعهاB‏ على الذاكرة اقل من الزمن المطلوب لقراءة ونقل ال ؟)ء 0|[ التالي الى الذاكرة . 


14 


disk block: ا أ‎ 1ı i+2 i 8 i+ 4 
fill A fill B fill A 1 fill B 1 fill A 1 
uO ا ا بج ت‎ 
1 1 1 | 1 
1 أ‎ 1 1 
1 1 1 1 1 
disk block: | i 1 i+ 1 i+ 2 1 i+ 3 1 i+ 4 
ı process A | process B process A , process B ı process A 
PROCESSING: 0 و — 2 و ا س‎ 
1 1 1 1 
1 1 1 1 ۱ 
1 1 1 1 
1 1 1 
نو سے‎ 
Time 


Figure (7) use of two buffers A and B for reading from Disk 


يمكن لل CK۴0‏ أن تبداً عملها على ال 810٥)‏ بمجرد وصوله الى الذاكرة الرئيسية وفي نفس الوقت تقوم 
disk /0 processor (controller‏ 4 بنقل وقراءة )٥0[ط‏ اخر على ۲اط اخرى . هذه الطريقة 
تJm buffering‏ ما0ubل‏ وايضا تستعمل لكتابة فيض من ال ءءه1ط المتتالية من الذاكرة الى ال 
dis)‏ عملية ال ع٣ buffer!‏ eا0ubل‏ تسمح بالقراءة والكتابة المتتالية للبيانات الموجودة على 
0ck)sاط‏ متجاورة مما ينقص ال ع10 Rotational delay seek‏ & لکل ال ocksاط‏ عدا ال 
)ء810 الاول زيادة على ذلك البيانات تكون جاهزة للتشغيل مما يقلل زمن الانتظار للبرنامج. 

1.ماهو الهدف الأساسي الذي أدي لضرورة ظهور تقنية ال ۸۸15؟ 

2كيف ساهمت طريقة ال 11۲۲0١۲1١8‏ في زيادة الاعتمادية ؟ 

3لماذا نجد ان ال 1 اعاعا ۸415 هي الأفضل عند التعامل مع البيانات المهمة جا والتي 

قد تتطلب زمن قراءة سريع للبيانات ؟ 


الد الرا 
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: Placing File Records on Disk 
وانواع السجلات والملفات ثم نناقش بعض طرق وضع هذه‎ ۲۴١0۲٩۵ في هذا الجزء نناقش مفهوم السجل‎ 
. السجلات على القرص‎ 
: records السجلات‎ 
هي نوع من انواع البيانات المرتبةء ولا يشترط أن تكون العناصر المكونة لها من نفس النوع .. ويقال‎ 
لعناصر البيانات الفردية انها حقول ء1٥۴1 داخل السجل فمثلا سجل الطالب يتكون من عدة حقول (اسمه‎ 
) وهو حرفي » رقمه وهو رقمي › تاریخ میلاده وهو تاریخ‎ 
. نقوم بدراسة التطبيقات لهذه المادة باستخدام لغة الباسكال لشيوعها وتمكن جميع الطلاب منها‎ 
: تعريف السجل‎ 
: تتيح لغة باسكال طريقيتين لتعريف السجلات‎ 
;VAR record name :RECORD field1; field 2; ...field n (1) 
;END 
مثال لھا نعرف سجل لبيانات زبون‎ 
VAR Customer: RECORD 
;Custno :1nteger 
;Custtype:char 
Custbalance:real 
END 
: نعرف نوع بيانات جديد ان سجل ثم بعد ذلك يمكن توضيح ان متغيرا من هذا النوع‎ )2( 
TAYPE name = RECORD field field2 ...field n END 
متلا لنفس سجل الزبون في المتال السابق‎ : 
Type Customer = RECORD 
Custno :integer; 
Custtype: char; 
Custbalance:real 
END; 
VAR cust:customer ; 
وهذه الطريقة اعم لانها تسمح تسمح بادخال متغيرات سجلات اضافية‎ . 
: RECORD PROCESSING Jجسll‎ Jıغشت‎ 
أولا يجب أن تكون السجلات من تفش الوح ملا‎ ١ اذا ارتا أن تحدة لجل ماقيمة ما لسجل خر‎ 
, VAR: old customer, New customer: customer 
:Begin 
New Customer: =Old Customer 
END 


وهذا يتم نقل جميع بيانات السجل New customer yJl 01d Cust011¢r‏ . 
اھک وات من کل اک اا ف 
New customer. Custno : = old ustomer.CustnOo‏ ; 
New customer. custtype : =oldcustomer .custtype‏ ; 
New customer .custbalance :oldcustomer.custbaknce‏ ; 
تشغيل السجلات عمليا يحتاج لهياكل بيانات اكبر لتحتوي السجلات» مثلا ان يكون لدينا ملف زبائن او 
منظومة تحوي عدا محددا من الزبائن فهنا نحتاج لتعريف منظومة ۸۲۲۵۷عناصرها سجلات وبهذا يتسنى 
لنا الوصول الى السجل الموجود داخل المنظومة . تعريف مثل هذه المنظومة كالاتي : 
VAR Cust:Array [1..100] of customer‏ ; 
فمثلا يمكننا نقل بيانات الزبون رقم 35 الى سجل الزبون رقم 20 
Cust [20| : = cust [35‏ [ ; 
او نقل بيانات حقل فقط من حقول زبون الى الحقل المقابل لزبون آخر ملا : 
;Cust [20].Custtype : =cust [35 ] .custtype‏ 
في بعض التطبيقات قد يكون بالسجل العديد من الحقول ونريد تشغيلها كلها . فهنا يكون من الافضل استعمال 
عبارةö WITH‏ بدلا من ان یکتب : 
New customer. Custno : = 16‏ ; 


New customer. custtype : A’; 
; New customer .custbalance := 315.6 


يمكن أن نكتب : 
WITH Newcustomer DO‏ 
Begin‏ 
Custno : = 16 ;‏ 
Custtype: = “A °;‏ 
Custbalance : = 315.6 ;‏ 
نو |ع لجات Variable length & Fixed length Record‏ 
يمكن أن تكون جميع السجلات المكونة للملف ذات احجام متساوية Fixed length Records and‏ 
length Records‏ eاvariab‏ وفي بعض الحالات يمكن ان تكون أحجام هذه السجلات غير متساوية 
وتكون سجلات الملف من النو ع (ئل0۲ءءع] طاعمء] م1ااهVari‏ ) لعدة أسباب منها الاسباب الآتية :- 
وجود حقل أو أكثر من حقول السجل احجامها مختلفة (sل[ع]؟‏ طاعہء] مVarİ1ab1‏ ) فمثلا حقل الاسم 
يمكن ان يختلف حجمه من سجل لاخر . 
- وجود حقل أو اكثر من حقول السجل يمكن ان تكون حقول اختيارية sل1ع1؟‏ امptionه‏ . 
- وجود حقل او اكثر اه اكثر من قيمة ويسمى ب Tepeating field‏ . 
:Record Blocking and Spanned Versus Unsnapped Records‏ 


السجلات المكونة للملف يجب تسكينها (أو وضعها) في عاط )ءال لان ال )ع81 هي وحدة نقل 
البيانات بين القرص و الذاكر ة الرئıuıة Block 1s the unit of data transfer between disk)‏ 
jl ll ( and memory‏ حجم B şa Block JI‏ ıillıڊã‏ ئ— File of fixed length records‏ 
بحجم كعر ۸ لكل سجل » وفي حالة ان 8<۸ يكون المعامل ۲ط يساوي : 

bfr = B/R records per block 
اقصی عدد من السجلات التي یمکن‎ ( Bاocking‎ actor for the ۴11e حيث ال ٣ط هي ال‎ 
) F تخزينها في ال )ءه[ط الذي حجمه 8 اذا کان طول السجل‎ 
: وعموما تنتج بعض المساحات غير المستغلة في كل 10ط هذه المساحة تساوي‎ 

B- (bfr * R) bytes 

ولاستغلال هذه المساحات يمكننا تخزين جزء من السجل في هذه المسحة المتبقية من ال 810٥)‏ وتخزين 
باقي السجل في )ه8 آخر مع وجود مؤشر ١۲٥011ص‏ في نهاية ال )ء810 الاول يوؤشر لل 
B10)‏ الاخر الذي يحوي باقي السجل هذه التنظيم يعرف بال 4 $411٥‏ لان في هذه الحالة السجل 
یمتد على اكثر من )10ط واحد . 
في حالة حجم السجل اکبر من حجم ال )810 يجب استخدام |— Jl .Spanned organization‏ 
UnsnaPpped organization‏ ل یسمح بتجاوز حدود 8٥٥K‏ لتخزین سجلات الملف . 


Block i Record1 R¢cord2 RecordB 


(a) 


Record5 Record Record7 
Block i+1 


Block i Record1 Recprd2 Record3 Record4 | P 


(b) 


Block i1 (Record4(reset Record5Record6 Record? ES 


Figure (8) Types of record organization. (a) Unsnapped. (b) Spanned 


البيانات المخزنة هذه تنظم في شکل ملفات من السجلات ۴11٥ ٥ ۲۴٥0۲۵‏ ولهذا يجب تخزين هذه 
السجلات بداخل الملفات بطريقة تسهل التعامل معها وهناك العديد من طرق تنظيم الملفات ع۴1 Pr1"a۲y‏ 
1101¡ والتي توضح كيف توضع السجلات فيزيائيا في الملفات وفي القرص » وبالتالي كيف 
يمكن استدعاء السجلات . منها ال عا م2ع1 وهذا النوع يضع السجلات بدون ترتيب حيث يضيف فقط 
السجل في نهاية الملف اما الملف المرتب ع11 QعS0۲‏ ١ه‏ 11ا١‏ عuيع؟‏ فيحفظ البيانات في شكل مرتب 
بناء حقل معین یسمی مفتاح الترتیب Sor) key‏ . 


Allocating File Block on Disk 


هناك عدة طرق لتسكين (وضع) كتل الملف )ه81 ۴11٥‏ في القرص. فمثلا في طريقة 01S‏ 01)11 
allocation‏ توضع الكتل (s)ه[ط)‏ في وهآ )ی1 متتالية »> مما يجعل عملية قراءة الملف 
سريعة جدا باستعمال ګ۲1۸٥uط‏ عااuمك‏ ولكن بالمقابل تكون الزيادة في الملف (الاضافة) صعبة . 
في طريقة 10۸ا4ه]اج إعkم1]‏ أى كتلة من الملف ععه[ط ع1ا تحتوى على مؤشر يؤشر للكتلة 
القالنة وغكس سابفقنها هذه لطر فة تخل الإشافة فى الملفت هة ولكن عة الفر اء ة للملف كاملا تكون 
بطيئة جدا. 
أما طريقة ksSع0]ط of consecutive disk‏ ustersاC‏ فھى عبارة عن هجین من الطریقتین 
السابقتين» حيث تجتمع الكتل ك)ء هط المتجاورة بوحدة أكبر تسمى ال إعئu[ع.‏ 

-:File header 
بادئة الملف أو واصفة الملف تحتوى على معلومات عن الملف والتى تحتاج لها البرامج التى تحتاج للوصول‎ 

الى السجلات بالملف. 
البادئة تحتوى على معلومة عن عناوين ال كع ه[ط المكونة للملف وطريقة تمتثيل السجلات ۲1٥٥014‏ 
mat description‏ والتی تحتوى على طول الحقول بالإضافة لترتيب الحقول فى السجلات من 
النو ع fixed length unspمa n1‏ وأیضا تحتوی على نوع الحقل » الفاصلات 864۲3٤0۲۶‏ ونوع 
السجل للسجلات من النو ع .variable length 1e°C0Fd‏ 
للبحٿث عن سجل بالقرص يجب نقل ck‏ 0ط واحد او buffer ةركIill Jl one or more block jis‏ 
ثم تقوم البرامج بالبحث عن السجل فى الذاكرة بإستعمال المعلومات الموجودة فى بادئة الملف . فإذا كان 
عنوان السجل المطلوب غير معروف فإن البحث یکون ط1٥۲ھع؟‏ ۲٥ہ‏ ]الكل الل Sعہ[ط‏ › حیث ننقل كل 
السجلات إلى الذاكرة حتى يتم العثور على السجل المطلوب أوينتهى الملف وهذه العملية تأخذ وقت طويل 
اا 
الهدف من التنظيم الجيد للملفات هو وضع ال )10ط التي تحتوى على السجل المطلوب بأقل عدد ممكن من 
حركة او .(blocks transfer blocks ) JI Jai‏ 


0 


e 
؟variable‎ length rec0Id 1._اذكر الأسباب التي أدت لوجود سجلات من النو ع‎ 
ملف حجم ال عم اط له 20 عtرط وطول السجلات في الملف عرا6:‎ 2 


-أحسب المعامل ۴۲ط 

-بالرسم وضح شكل ال )ء810 اذا علمت ان التخزين كان من النو ع أ٥١٣aمS‏ 
organ1Zzatlon‏ 

-ارسم شكل ال )10ط مرة أخري إذا كان التخزين من النو ع ٣‏ 4۸مء, U‏ 
Organization‏ 


.عرف سجل طالب 51٨‏ بلغة باسكال يحتوي علي الحقول التالية :- 
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رقم الطالب › إسم الطالب » تاريخ الميلاد › السنة الدراسية 
- إستخدم التعريف في نقل بيانات سجل إحد الطلاب لسجل طالب آخر 
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الد س الخامس 
Operations on files‏ 


يمكن تقسيم العمليات على الملفات الى مجموعتين رئيسيتين هما : 
-1عمليات اتر جاع Retrieval operat101S‏ 
-2 عمليات تعديل 210158]عصop update‏ ا Retrieval operation‏ لاتقوم باي تعدیل علی 
الملف ولكن تقرأً فقط السجلات المحددة . أما ال ك٣‏ 10اaاeعمpه‏ عat upd‏ فهي تجري التعديل على 
الملف اما بالإضافة او الحذف او تعديل حقل في السجلات. 
انا في كلا الطریقتین نحتاج لاختیار سجل او سجلات بناء على شرط اختیار معین 0۲ 1101ع 
tering condition‏ والسجل او السجلات التي تستوفي الشرط السابق المحدد . 
متلا سجل الموظف الذي حقو ل4 :Name , SSN,Salary , Jop, departn¬ent‏ 
فيمكن ان يكون شرط الاختيار البسيط simple selection co01d1{101)‏ ( ب Equality‏ 
operat‏ علامة تساوي : مثلا 
(Department = 'Account) yl (SNN =1324)‏ 
او 5000> (Comparison operation : (Salary‏ .... 
تعتمد عمليات البحث في الملف عموما على شرط اختيار بسيط Il, simple selection c0ndi†101‏ 
كان الشرط معقد فيجب ان تقوم 818[ او المبرمج بتجزئته لشروط بسيطة يمكن ان تستعمل للوصول 
الى السجل ثم يختبر بعد ذلك اذا كان هذا السجل يحقق بقية الشروط فمثلا اذا كان كان الشرط: 
(Department = 'compute”) and (Salary >5000)‏ 
فإننا نستعمل أو لا الشرط '4٥٥011٤‏ = ٤1ع‏ )اهمع( فبعد الوصول للسجلات التي تحقق هذا الشرط 
نقوم باختبار الشرط الاخر وهو 5000< yاهاة؟‏ . 
اذا كانت هناك عدة سجلات تحقق شرط البحٿ فاول سجل نصل اليه يكون هو ال curren) ۲۴٥014‏ تم 
ننتقل منه الى بقية السجلات . 
العمليات على الملف للوصول الى السجلات والعمل عليها تختلف على حسب نظم ادارة قواعد البيانات 
ال DBMS‏ و اللغة المستعملة ولكن على العموم يمكن حصرها كالاتي :- 
pn‏ 0: تجهز الملف لعملية القراءة او الكتابة ویتم حجز عدد ملائم من ال ۲٥٤گ‏ اط على الاقل اثنين 
لوضع ال ء)ع 0[ بها تقوم بقراءة ال 1٥406۲‏ ٥[1]؟‏ ووضع مؤشر الملف في بداية الملف. 
€ : تضع مؤشر الملف المفتوح في بداية الملف . 
)۴İ )0r cate‏ : تبحث عن أول سجل يحقق شرط البحث وتنقل ال )ء٠1‏ الذي يحوي السجل 
الذي يحقق الشرط في الذاكرة ١6۲گااط‏ ويقوم مؤشر الملف بالاشارة الى السجل في ال ۲اط ليصير 
السجل الحالي current re°COId‏ . 
Read (or Get‏ ) : تتسخ السجل الحالي ۲۴٥0۲۵‏ )۸٣10۲۲۵اء‏ الموجود في ال ۴۲ا اط الى البرنامج 
الذي يطلبهء ايضاأ قد تحرك مؤشر الملف الى السجل التالي الذي قد يكون مطلوب بعد هذا السجل . 
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:۴nd Next‏ تبحث عن السجل التالي الذي يحقق شرط البحث» تنقل ال )10ط الحاوي لهذا السجل الى 
buffer‏ ( اذا لم يكن اصلا موجودا بها ) »> يوضع السجل في ال ]لاط ويصبح السجل الحالي 
current record‏ . 

. تم تعدل الملف على القرص‎ 10۲۲۴١٤ ۲۴٥0۲۵ تعدل قيمة حقل بالسجل الحالي‎ : Modify 

t0 تمسح السجل الحالي ٤٣1۲۲۴اء ثم تعدل الملف على القرص لعكس عملية التعديل ]۴ع‎ : eet 
. the modification 

ئ : تضيف سجل جديد بالملف حيث تحدد اولا ال )ع 10ط الذي يدخل به السجلء ثم تنقل هذا ال_ 
ockاط‏ الی ال ۲ع٤گuط‏ (إِن لم یکن موجود) تکتب السجل على ال ۴۲]گاط ثم تكتب محتوى ال 
uff‏ في القرص . 

6 : اكمال عملية الوصول والتعامل مع الملف بتحرير الSاع]buf‏ . 


كل العمليات السابقة (عدا open and cose‏ ( تسم record at a time operation‏ لان أي عملیة 
تنفذ على سجل واحد يمكن ان نجمع العمليات 20ء۸ 1٥×)‏ ۴104 ,ل10 في عملية واحدة تطبق على 
الملف وهي 5٥41‏ وهذه المجموعة من العمليات تسمى set at time 0p€۲23101۸‏ . 

2ه : اذا تم فتح الملف في هذه اللحظة فان ال 504١‏ تعطي اول سجل » وفي غير ذلك تعطى السجل 
التالي . اذا تم تحديد شرط مع هذه العملية فهي تعطى اول سجل يحقق الشرط ثم التالي . وهكذا . وتوجد أيضا 
امثلة للعمليات من النو ع set at {1ıe 0p€۲2)101‏ . 

۴٩ 11‏ : تحدد كل السجلات بالملف والتي تحقق الشرط . 

. تسترجع کل السجلات بالملف بترتیب محدد‎ : ۴d ordered 

... تبدأً عملية التنظيم كما سنرى لاحقا بعض تنظيمات الملف تحتاج إعادة ترتيب دوريا‎ : Re|7 
ا لے کل اک‎ 


نميز فيما يلي بين مصطلحين وهما : 

Access method and File organization :‏ 
Fe organiation‏ : تنظيم الملف نعنى به تنظيم البيانات داخل الملف إلى سجلات و Sكعه1ط‏ 
ونعنى به أيضا هياكل الوصول إلى البيانات 5۲0٥00۲88‏ 400858 ونعني به أيضا طريقة وضع السجلات 
وال ك)عه[ط في وسائط التخزين . 
:Access method‏ طريقة الوصول الى البيانات تضم مجموعة من العمليات التي تتيح التعامل مع الملف 
(مثل العمليات الموضحة سابقا) على کل حال یمکن ان نطبق عدد من ۲104ع ۶ءعc٥۸‏ على تنظيم معين 
للملفات فمثلا ال ككعءعه 14×٥4‏ لايمكن ان يطبق الا على الملف المفهرس بصلا . 

عادة نختار تنظيم الملف وطريقة الوصول حسب طبيعة العمل في الملف فمثلا بعض الملفات تكون 

٤٥‏ بمعنى أن التعديل فيها لايذكر بينما بعض الملفات [۷12001٥‏ بمعنى أن التعديل فيها مستمرء 
بعض الملفات نحتاج فيها لقراءة كمية من السجلات في اللحظة الواحدة . 
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ما إذا حدد المستخدم انه يبحث عن بيانات الموظف برقمه اذا يقوم المبرمج ببناء الملف مفهرسا برقم 
الموظف أو نحتاج الوصول للبيانات بالقسم فبالتالي نرتبها بالقسم وهذا ما سيتم توضيحه في الجزء الخاص 
بالفهرسة . 
Files of Unordered Records Heap File (1)‏ : 


يعتبر هذا ابسط نوع من أنواع تنظیم الملفات 0۲2۵1۸1234101۸ ۴٥۴‏ حيث تدخل السجلات الى الملف 
حسب ترتيب ادخالها فيه .... السجل الجديد يدخل في نهاية الملف » يسمى هذا النو ع من الملفات ع1ا مجع 
1e‏ eا¡p‏ اه وهذا النوع يستخدم لاستعمالات خاصة مثل e×٥S‏ ل11 21y‏ لته او حفظ البيانات 
لاستعمال مستقبلي في هذا النوع من الملفات : 
#عملية الاضافة لسجل سريعة جلا ويمكن وصفها في الخطوات الاتية: 
1.يتم نسخ ال )10ط الاخير من الملف الى ال ١ء]buff‏ . 
2.يضاف السجل الجديد الى هذا ال )عاط . 
3.يكتب ال )عط مرة اخرة في القرص ١ع‏ ))!]Wء۲‏ 
#عنوان ال 1ط الاخير من الملف يحفظ في ال File header‏ . 
* عملية البحث عن أي سجل باي شرط يتطلب المرور على كل ال ء)عه1ط واحدا تلو الاخر Lin‏ 
8ع .. وهي عملية مكلفة اذا كان هناك سجل واحد يحقق الشرط فيجب على البرنامج أن يقرا نصف ال 
ئ (في المتوسط) قبل ان يجد السجل المطلوب فمثلا لملف حجمه ك)ءه[8 8نبحث في عدد 
B10) 2‏ اما اذا كان هناك اكثر من سجل يحقق الشرط أو لا يوجد أي سجل يحقق الشرط فيجب على 
البرنامج ان يقرأ كل ال )هط 8 ليبحث في كل السجلات . 
#عملية الحذف تكون كالاتي : 
1.ابحث عن السجل المراد مسحه . 
2.انسخ ال )10ط الذي يحوي هذا السجل الى ال ١uf]۴ط‏ . 
3.امسح السجل من ال buf f۲‏ . 
4.أعد كتابة ال إعbuff‏ في Disk‏ . 
عملية المسح هذه تترك فراغات في ال عه|اط . 
هناك آلية اخرى لعملية المسح ..... وهي ان يكون هناك 0/٥‏ 0۲ 61 مصاحبة لكل سجل تسمى علامة 
المسح marke‏ etionاعل‏ عند مسح السجل فقط توضع قيمة محددة في هذه العلامة (مثلا صفر تعني ان 
السجل محذوف والقيمة 1 تعني ان السجل موجود ) › برامج البحث العاملة على مثل هذا النوع من الملفات 
التي تستعمل هذا النوع من الحذف تراعي هذا المؤشر. كلا هذين النوعين من آليات الحذف تحتاج ملفاتها 
لاعادة تنظيم ورت )Reorganiation)‏ لإعادة استغلال المساحات الفارغة في ال )عه|اط . 
#اعادة تنظيم الملفات تتم دورياً لاعادة استغلال المساحات الفارغة أثناء هذه العملية تتم قراءة ال kSعه1ط‏ 
على التوالي . ثم تجمع السجلات الموجودة في ال ء)عء0[ط من جديد وتلغي السجلات المحذوفة. بعد 
اكتمال عملية اعادة التنظيم تكون المساحة بافضل استغلال . 
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يمكن بالية اخرى لاعادة التنظيم ان نستعمل مكان السجلات المحذوفة للكتابة فيها مرة اخرى › ولكن هذه 
العملية تحتاج لمعرفة الاماكن الفارغة التي يمكن ان نكتب بها بكل ال كعهاط . 
یمکن ان نستعمل spanned or unspanned 0۲]£211Z2)101‏ کتنظیم للملف غیر المرتب !٥24p(‏ 
fixed or variable length records —lI Jaعتıت j| jay اnك ( file‏ . 
عملية التعديل في ال 0۲ء۲ طاعمء]ا eاvariab‏ قد تتطلب مسح السجل القديم ثم إدخال 
السجل الجديد (بنهاية الملف) لان السجل الجديد قد يكون اكبر من القديم وبالتالي لاتسعه المساحة القديمة . 
#لقراءة جميع السجلات بترتيب معين ننشئ نسخة جديدة من الملف مرتبة وعملية الترتيب للملف مكلفة 
كلما كان حجم الملف اكبر. 
الملفات غير المرتبة اذا استعملت fixed length records using unsnapped blocks and)‏ 
contiguous allocation‏ ) يكون الوصول الى أي سجل بموضعه في الملف فاذا كانت السجلات مرقمة 
۲-1,....,0,,2 والسجلات داخل ال )عاط أيضا مرقمة ۴۲-1,...,0,1,2ط (حیث ۴۲ط هو ال 
locking factor‏ ) : السجل رقم ] في الملف يحدد موضعه كالاتي : 
في (bfr) pۃãر block‏ 
وداخل ال )عه1ط في سجل رقم (I1 mod bfr)‏ 
هذا النوع من الملفات ولان السجلات يمكن الوصول اليھا حسب موضعها يسمى relative OF d1İeCt‏ 
file‏ . 
:(T T1 (Files of Ordered Record (Sorted files)‏ 
ق 1¥ء ارا ناء على قيمة احد حقول الملف ويسمى حقل الترتيب 
ordering fied‏ . وھذا یعطی ملفاً مرتبا ordered or segue ntia1 ۴11٥‏ فإذا کان حقل الترتیب 
هذا هو حقل مفتاحي في الملف 14ء1؟ ره أي لاتتكرر قيمته في اي سجل آخر فهو ( فرید او 
Unive‏ )» نقول انه ¥ ٣"‏ اماه . الشكل التالي بين ملف مرتب وحقل المفتاح ۴114 رم» به 
هو الاسم وهو اک حقل الترتیب 14ع1٤ ord er1 ٢g‏ اذن نقول ان JlحتJ ordering key ga name‏ 
field‏ . 
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Figure(9) : Some blocks of an ordered (sequential) file of Employee Records With Name as 
.the ordering Key field 


مات افر فة اقل من الفات غر المرقة لات ه 
من غير 
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1قراءة السجلات على حسب مفتاح الترتيب تكون سريعة جدا لاننا لانحتاج لاجراء عملية ترتيب 
للبيانات. 
2.الوصول الى السجل التالي من السجل الحالي على حسب ترتيب المفتاح» غالبا لايحتاج لقراءة 
عاط اخر من ملف وذلك لان السجل في نفس ال 10ط الحالي ( إلا أن يكون السجل 
الحالي هو الاخير في ال ٠اط‏ ) . (بحيث لايوجد بعده سجل مخزن ) 
3.استعمال مفتاح الترتیب k٤۷‏ gہ1۸اrمdإاه‏ کشرط للبحث 1)101۸لonەc Search‏ يؤدي 
لسرعة عملية البحث . وذلك عند استخدامنا لخوارزميه البحث الثاني Binary ۶٥4۲٥1‏ » 
وهي أفضل من خوارزمية ال 1٥2۲ع‏ 11103۲ . ( والتي تقوم بالبحث داخل السجلات واحدا 
تلو الاخر ) . 
يمكن اجراء عملية البحث الثائي 584۲٥1‏ 8113۲ في الملفات على مستوى ال s)ء810‏ بدلا من 
السجلات لتحديد ال )10ط المطلوب ومن ثم نقوم بالبحث داخل ال )٥1ط‏ للوصول الى السجلات . 
افترض وجود ملف مكون من عدد [ من ك)عه‌آط مرقمة من 5....,1,2 بحيث تكون السجلات مرتبه 
حسب مفتاح الترتیب داخل هذه ال [0٥S‏ فاذا کنا نبحث عن سجل موظف يبدأ اسمه بالحرف ‏ وبفرض 
أن عناوين ال كعهاط ءال موجودة في إعل4عط ع۴11 » فان الخوارزمية التالية تصف عملية البحث 
الثنائي . 
خوارزمية البحث الثنائي : 
Algorithm :Binary Search on an Ordering key of a disk file‏ 
L<—1;ju<—b; (* b is the number of file blocks * )‏ 
While (u > L) do‏ 
Begini <“ (Lu) div2;‏ 
Read block 1 of the file into the buffer ;‏ 
ifK < (ordering key field value of the first record in block 1).‏ 
then u ~1 — 1‏ 
else if K > ( ordering key field value of the last record in block 1)‏ 
then L — i+ 1‏ 


else if the record with ordering key field value = K is in the buffer then go 

to found 

else go to not found 

end; 

go to not found 

تقوم خوارزمية البحث الثنائي بقراءة عدد [) 102) من ال 10ط في حالة وجود السجل ام لا. بينما 
في خوارزمية ال 1طء۲ةعء إهعم11 تقراً عدد (كkعم1ط‏ (2/ط في المتوسط اذا وجد السجل وعدد طا 

من ال ء)عه]ط اذالم يوجد . 
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E 
ملف عدد ال ء)عم8B1 به تساوي 120 )عاط » أحسب عدد ال sءعءعcھ )عاط إذا تم البحث عن‎ 
-: سجل داخل الملف وذلك في حالة‎ 
1.الملف مرتب بناء علي حقل ترتيب.‎ 
2.الملف غير مرتب.‎ 
-: الحل‎ 
: 1.الملف مرتب إذن نستخدم خوارزمية البحث الثنائي للبحث عن السجل‎ 
Block access= log2 b = log2120 = 7 block access 
2.الملف غير مرتب‎ 
: في افضل الاحوال وفي حالة وجود السجل‎ 
block access =b/2 =120/2 =60 block access 
: في حالة المرور علي كل السجلات وعدم وجود السجل المطلوب‎ 
Block access=b =120 block access 


تتضم ن طري ةة البحٿ ال شروط< ١ك‏ »> >< 
وذلك بناء على مفتاح الترتيب حيث تكون اكثر كفاءة . حيث أن الترتيب الحقيقي للسجلات يضمن أن كل 
السجلات التي تحقق شرط البحث تكون في ك)ءه[ط متتالية مثلا بالرجوع الى الشكل (9) اذا كان شرط 
البحث (6“ > ٥۳هل"‏ ) بمعنى بالترتيب الهجائي (قبل ال 6).. هذا يعني أن السجلات التي تحقق الشرط 
تكون من بداية الملف وقبل اول سجل يبدأ فيه حقل الاسم بالحرف 6 . 
الترتيب على اساس حقل معين غير الحقل المفتاحي لايفيد عند اجراء عملية البحث الثنائي في الملف» بمعنى 
أنه اذا كان الملف مرتب بحقل الاسم N2078‏ 14عا؟ ordering‏ وكنا نبحث بحقل المهنة اهز فان هذا 
الترتيب لا يفيد » وعلينا عمل نسخة أخرى من الملف مرتبة حسب ال ط0ز أو البحٿث ب 11,٥24۲‏ 
عك في الملف القديم . 

في حالة ان الملف مرتب يمكننا اجراء عملية البحث الثنائي 1٥2۲ع B123‏ اما اذا كان 

غير ذلك فیتم البحث عن طریق 1٥2۲ع؟s‏ ٣2ہ‏ ]] . 
الاضافة والحذف في الملف المرتب :- 
عملية الإضافة والحذف تعتبر مكلفة جدا في الملف المرتب لان السجلات يجب ان تبقى مرتبة في الملف عند 
الاضافة او إالنلحنف physically ordered‏ . 
لإضافة سجل يجب اولا أن نجد له المكان المناسب الصحيح في الملف بناءا على قيمة الحقل المفتاحي له . ثم 
نوجد مساحة لإضافة هذا السجل وذلك بإجراء عملية إزاحة للسجلات» وهذه العملية تكون اصعب كلما زاد 
حجم الملف لانه في المتوسط نحتاج لإزاحة نصف السجلات لايجاد المكان الفارغ للسجل الجديد . وهذا يعني 
أن نصف عدد ال ك)ع0[ط المخزنة تتم قراءتها من ال كال ثم تعاد كتابتها مرة أخرى . 
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في عملية الحذف المشكلة اقل فيمكن أن نستعمل ال ۲إ )إ2 ااال وهي علامة خاصة توضع 
في نهاية السجل للدلالة على حذفه. ودوريا نقوم باعادة التنظيم للملف ۲۵0۲82712310۸ للتخلص من 
اللات اة 
ويمكننا لزيادة كفاءة عملية الاضافة ان نبقي على بعض المساحة غير المستغلة في كل )10ط تحسبا 
و ها جل موقت فر هاه اة الاد اة ن اة ات اة وة 
اخری . 
هنالك طريقة اخرى وهي انشاء ملف مؤقت غير مرتب لنكتب فيه السجلات الجديدة ويسمى بملف الفيضان 
transaction or overflow file‏ . وبينما يىمى الملف إلاصJ„‏ ب— main or master file‏ 
تدخل السجلات الجديدة في نهاية ملف الفيضان بدلا من إدخالها في مكانها الصحيح حسب الترتيب في ال 
ماگ مزه ودورياً تتم عملية ترتيب لملف الفيضان ودمج الملف الرئيسي مع ملف الفيضان ليرتب الملف 
الجديد مرة أخرى ويتم هذا أثتاء عملية إعادة التنظيم ۲80۲831123)101٩‏ دوريا . وبهذا تصبح عملية 
الإضافة اكثر كفاءة ... ولكن في المقابل زاد التعقيد في عملية البحث »› حيث تكون عملية البحث كالاتي :- 
ابحث في الملف الرئيسي( المرتب) باستخدام خوارزمية 1٥2۲عS‏ 4۲۷١1ط‏ . 
اذا وجد السجل المطلوب 
- اذهب الى النهاية . 
- والا ابحث في ملف الفيضان( غير المرتب) باستخدام خوارزمية 1٥4۲عS‏ 4۲ع 11١,‏ 

عملية التعديل في الملف المرتب : 
تعديل قيمة حقل ما في ملف مرتب تعتمد على عاملين :- 

أو کون ا ا 

2.الحقل المراد تعديله . 
فإذا كان شرط البحث يعتمد على حقل المفتاح يمكن الوصول الى السجل باستخدام خوارزمية ال ٣۵ط‏ 
search‏ وفيما عدا ذلك يجب ان نجري خوارزمية JIئ— linear search‏ . 
اما اذا كان الحقل المراد تعديله حقل غير ترتيبي 1ع 0۲٥۲1۸4‏ 10۸ فهو يعدل ثم تعاد كتابته في 
نفس موقعه في الملف the same مhysica1 ]0cat10۸‏ باعتبار أننا نعمJa‏ eل” fixed length‏ 
۴٩4‏ أما تعديل حقل الترتيب نفسه قد يستلزم أن السجل يجب أن يعدل موضعه الحقيقي في القرص مما 
يتطلب مسح السجل القديم واضافة السجل الجديد. 
عملية القراءة : 
بتجاهل ملف الفيضان تكون عملية القراءة سريعة جدا وذلك لان ال ك)ءه1ط تقرأً بالتتالي باستعمال ال 
buffering‏ eاoubلd‏ .آما بأخذ ملف الفيضان في الحسبان يجب ان :- 

1ترتیب ملف الفیضان 0v eإ 10W‏ ارلا . 

2دمج الملف الرئيسي مع ملف الفيضان للحصول على ملف جديد مرتب مع مراعاة حذف 

السجلات المؤشرة .( وهي السجلات المحذوفة سبق وب عlٹnة Deletion Marker‏ (. 
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الد س السادس 


Hashing Technique ةرأiعبئl تفن‎ 


إحدى طرق تنظيم الملفات الاساسية ترتكز على فكرة ال g١11ك4ط‏ والتي توفر سرعة في الوصول 
للسجلات بناء على شرط بحث معين وهذا النو ع من التنظيم يعرف Direct —.I yl hash file dl‏ 
.file‏ 
شرط البحث يجب أن يكون شرط تساوي اعتمادا على حقل واحد من حقول السجل يعرف بال یج8 
1 للملف. وفي اغلب الحالات يكون ال 14ع طئه۲1 أيضاً هو حقل مفتاحي ل1عا؟ لإهk‏ للملف 
وفي هذه الحالات يعرف بال hash key‏ . 
الفكرة الاساسية لل 1211١8‏ هي وجود الدالة 1 والتي تعرف بال ۸٥0ااعصں؟‏ مط أو ال 
Randomize function‏ » تستخدم الدالة قيمة ال 14ع طیوجط للسجل لإنتاج عنوان ال )عاط 
الذي سيتم تخزين السجل فيه على القرص . اما البحث عن السجل في ال )10ط المعين فيتم في الذاكرة 
الرئيسية main memory bu f6۲‏ » مع معظم السجلات نحتاج فقط للوصول الى 010٥)‏ واحد 
-b10ck) access‏ eاng‏ للوصول للسجل المعنى . 

: Internal hashing 
ويتم تطبيق ال 121118 هنا في صورة جدول يسمى ب ع1طها 1ئ1 من خلال استخدام مصفوفة‎ 
×N-1,...,0,1 بالترقيم‎ M1 ٥٥014 گ0 4۲۲4۷ . افترض ان المصفوفة مكونة من عدد‎ ۲۴٥0۲4 سجلات‎ 
1ج1 المناسبة لتحويل‎ ۴01٥٤10١ ولدينا عدد 1 خانئة بالعناوين المقابلة لعناوين المصفوف» نختار دالة‎ 
قيمة ال 1ء1 اوج1 لقيمة صحيحة 1)0۲[ تقع في المدى بين 0-1....0 » وواحدة من اشهر دوال‎ 
: الشائعة الدالة‎ Hash function ال‎ 

h (k) = k Mod M 

التي تعيد باقي قسمة العدد & على العدد ۷ . وهي القيمة التي تستخدم كعنوان للسجل . 


29 


(aj NAMIE SSN el SALARY 
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م‎ 3 2 
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* null pointer = 1, 
" overilow poirter refers to position of next record in linked list 


(10): Internal hashing data structure 
(a) Array of M position for use in internal hashing (b) Collision resolution 


by chaining records 


بالنسبة للارقام الغير صحيحة لل 14ع اطهط كالحروف ما يتم تحويلها لارقام صحيحة 8©۲ع)11 
قبل تطبيق دالة ال M04‏ باستخدام ال مdهء ۸S€٣11‏ المقابل لها . 
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مثال : 
ال £ 14ء1 hash‏ لسجل نوعية بياناته حرفيه من 20 حر string of 20 characters‏ « 
array ]1 ..20 [ of char‏ = & ؛ » الخوارزمية التالية تستخدم لحساب ال ك١٥] add‏ طط (الدالة 
تعيد ال 11 code AS€‏ للحرف ) : 
Algorithm (a) : applying the mod hash function to a character string K:‏ 
Temp ~1;‏ 
For 1 :1 to 20 Do‏ 
Temp ~ Temp * code (k [1]) mod m ;‏ 
Hash address ~ Temp Mod M ;‏ 
وتوجد انواع عديدة لدوال ال 11٥10١‏ 1ج1 تقوم بحساب العناوين بطرق مختلفة. 
حدوث التصادم :- 
مشكلة اغلب هذه الدوال انها لاتضمن للقيمة الناتجة عنوان فريد (لايتكرر) خاص بها وذلك لان ال طئهط 
space‏ 1ع (وهو مدى القيم التي يمكن أن تاخذها ال 1ع طط ) دائماً اكبر من ال كك add‏ 
همك ( وهو عدد العناوين المتاحة لتخزين السجلات ) مما يؤدي لحدوث التصادم او ٥01115101‏ عندما 
تنتج الدالة بناء على قيمة ١1ع1٤‏ ئ12 لسجل معين قيمةءو هذه القيمة تمثل عنوان للتخزين يحتوي على 
سجل آخر . في هذه الحالة يجب ايجاد موقع جديد › عملية ايجاد موقع جديد للسجل تعرف بال 
Resolution‏ isionاCo1‏ حیث توجد طرق عدیدة لل ReS010)101‏ isionاiاco‏ ومنھا :- 
open addressing‏ -1 
2-chaining‏ 
3-multiple hashing‏ 
الخوارزمية (0) توضح إحدى طرق Collision res01ut10¬‏ : 
Algorithm (b) : Collision resolution by open addressing :‏ 
i hash _ address (k) ; a1;‏ 
If location I 1s occupied then‏ 
Begin‏ 
i (i+1) Mod M ;‏ 
While (1 <> a ) and location i is occupied do‏ 
i <— (1+1) Mod M ;‏ 
If (i= a ) then all position are full‏ 
Else new hash address <1;‏ 
End ;‏ 
الغرض من ال ٥10١‏ صنا؟ ع«اطهط الجيدة توزيع السجلات بصورة مثلى على العناوين المتوفرة 
وتقليل التصادم ١10ء0111‏ بالإضافة لتقليل حجم المواقع غير المستغلة. 
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External Hashing for disk files: -‏ 
عملية ال ع1 11ئة8 علي القرص تسمي ب 1281112 8x ern21‏ ولملائمة خصائص القرص تم 
عنونة المساحات عن طريق ما يعرف ب Buc) es‏ . ال Bucket‏ عبارة عن )10ckط‏ واحد أو 
مجموعة من ال )عاط المتجاورة من السجلات كل0۲-٥ ۸e‏ . 
(A bucket is either one disk or a cluster of continues blocks)‏ 
تقوم دالة ال 101اuncگ Hashing‏ بإنتاج yعk‏ وربطه برقم ال اع)عاط الذي له علاقة برقم ال 
key‏ الناتج. 
ویوجد جدول بال ۲٥ل4٥ط ٤11e‏ لتحويل رقم ال )عط لرقم أو عنوان disk block JI‏ 
التاظر: 
شکل رقم 11 . 


Figure(11) : Matching Bucket numbers to disk block addresses 


ويقل حدوث مشكلة التصادم 10۸ء111اهء مع ال ءاع)kعuط‏ وذلك لان العديد من ال ksعه1ط‏ يمكن أن 
توضع في ال٤٥‏ )عاط من غير حدوث مشاکل (اکثر من )٥1ط‏ لها عنوان واحد يمتل عنوان ال 
)عاط المخزنة داخله ) وفي حالة امتلاء ال اعkعuط‏ ووصول )عمط جديد لیضاف bucket Ji‏ 
یمکن استخدام ال varlati0n o£ c121111£‏ حیث یتم استخدام مؤشر 011٥۲‏ موجود بال 
bucket‏ يشير لسلسلة متصلة من السجلات الفائضة bucket (overflow [records je‏ ( . 
المؤشرات في السلسلة عبارة عن مؤشرات لسجلات (۲5٥٤011م ۲٥0۲١‏ ) هذه المؤشرات تحوي عنوان 
ال عاط وموقع السجل داخل ال )عاط . 
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E EE EE أ ا‎ 
|_ record pointer ا‎ 


bucket [a= | 


الل ¡j‏ 
ا 


Figure(12) :Handling overflow for buckets by chaining 


تمكننا تقنية ال ع«أطئهط من سرعة الوصول والاسترجاع للسجلات بنا على قيمة ال ل[عا؟ ئها 
الاك ا : 
الوصف السابق لتقنية ال 14١11١2‏ يسمي بال ۴١۸1ءهط‏ عاtهاء‏ حيث يتم تسكين عدد محدد 10 من 
ال 8٤e)عuاط‏ وهذا يعتبر مشكلة خطيرة عند التعامل مع الملفات ذات الأحجام المتغیر Dynamic File ö‏ 
. افرض انه تم تسکین عدد یاckeںuط M۸‏ وکل cketںuط‏ یمکن أن یسع ۲۴٥0۲۵‏ ۳ إذا عموما سیکون 
لدينا عدد M buckets JÛ «Jal (¬ * M)‏ . 

وإذا قل عدد السجلات ۲٠٤0۲١١‏ عن ال ١ *١M(‏ ) ستظهر العديد من المساحات غير المستقلة ومن 
الناحية الأخرى إذا زاد عدد السجلات ۲٠٥0۲۵‏ عن *٥M(‏ ۳" ) يمكن أن يحدث ال (ئ« 10ا1٤‏ ). 
أيضا عملية استرجاع السجلات سيصبح أبطاً بسبب القوائم الطويلة من سجلات الفيضان 0۷6۲۴10۷ 
86 ۴ ۴ » إذن في كلا الحالتين نحتاج لتعديل عدد M‏ من hashing مlدختul, bucket JI‏ 
function‏ جديدة لتوزيع السجلات . 
عمليات إعادة التنظيم هذه تستغرق وقت طويل بالنسبة للملفات الطويلة.توجد عمليات تنظيمية جديدة لل 


dynamic fe‏ باستخدام تقنية ال 1481108 تسمح بزيادة عدد ال ٥8‏ )عا ديناميكياً باستخدام 


عمليات إعادة تنظيم محليه localized re0°1£411Z4)101‏ . 
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عملية البحث عن سجل عند استخدام ال ع111كهط اهnاما×ء‏ عن طريق أحد الحقول الاخرى غير حقل 
ال 1dعا؟‏ طط تكون عملية مكلفة جداً . وذلك كما يحدث في حاله unordered file JI‏ . 
حذف السجل یتم بحذفه من ال sاع)عںط‏ اما اذا کان لل sاع)kعuط‏ سلسلة فيضjl overflow chain‏ 
يمكن نقل احد سجلات الفيضان الى ال )عاط ليحل محل السجل المحذوف . اما اذا كان السجل المراد 
حذفه عبارة عن سجل فیضان W ۲٥٥0۲4‏ 0۷61۴10 فيمكن حذفه بسهولة من السلسلة وتعديل السلسلة 
المتصلة . 
اما بالنسبة لعملية تعديل حقل في سجل فاننا نعلم ان التعديل يعتمد على عاملين : شرط البحث والحقل المراد 
تذل : 
فاذا كان شرط البحث هو (مساواة) مع ال 1٥1d‏ 1ء14 فذلك يتيح الوصول بكفاءة للسجل باستخدام ال 
hashing fed‏ والا فیجب في غیر ذلك استخدام linear search JI‏ . 
أما تعديل ال 1dع1؟‏ أوجط ممم يتم بتعديل السجل واعادة كتابته مرة اخرى في نفس ال )عاط بينما 
تعديل ال 14ع طوهط فيعني ان السجل يمكن ان ينتقل الى ٤ع‏ )عاط اخرى وهذا يتطلب حذف السجل 
القديم واضافة السجل المعدل . 
كما ذكرنا سابقا ان العيب الاساسي لل ع٣‏ 1طءجط cاt1هtء‏ يكمن في ان hash address space —I‏ 
محدودة مما يجعل عملية التغيير بالتمدد او الانكماش في حجم الملف صعب للغاية . ويوجد حلان لهذه 
المشكلة : 

1-Extendable hashing . 

2-Linear hashing . 
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الدرس السابع 


الفهارس ء¢×عء 1۸d‏ 


في هذا الفصل نفترض ان هناك ملف موجود صلا بتركيب معروف متل الملف المرتب او غير المرتب . 
وهنا نقوم بدراسة هيكل بيانات جديد مساعد يسمى الفهرس ٥×‏ 110 والذي يساعد على زيادة سرعة 
استرجاع البيانات في الملف بناء على شروط بحث محدده. 

الفهرس يوفر طريق اضافي للوصول الى البيانات دون ان يؤثر على الوضع الطبيعي او الحقيقي 

1 كلام للسجلات في الملف على القرص » وانما فقط يمكن الوصول السريع للسجلات بناء على مفتاح 
الفهرسه كل[ع1؟ 10g×ع 1١‏ » وحقيقة أي حقل في الملف يمكن ان يستعمل لإنشاء فهرس أو فهارس 
متعددة S٥×ع 1١‏ عآم1ااناا وبهذا قد يكون هناك العديد من الفهارس على مختلف الحقول في الملف 
الواحد .د 

للوصول الى سجل او سجلات محددة في الملف معتمدين على شرط بحث محدد وباستخدام الفهرس المناسب 
indexing 4‏ » يجب اولاً ان ندخل الى الفهرس نفسه والذي بدوره يشير الى كتلة او مجموعة من 
الكتل في الملف ءعمآط مامص ۲ه عn٠‏ والتي تحوي السجل المطلوب. 

قوی أنواع الفهارس تعتمد على الملف المرتب (e5×ع‏ ہ1 1م1۷ مآعم1ء ) . كما يمكن للفهارس ان تبنى 
باستخدام البعثرة 1481108 او أي هيكل بيانات يساعد على عملية البحث . 

clustering « „aş single level ordered 1¬dex —l| وفيما يلي ندرس مختلف اناع‎ 

primary , secondary‏ و بالنظر الى أن ال ×ع ,ہ1 ام1۷ ماعمآء كملف مرتب يمكن أن نعمل 
عليه هو نفسه فهرس محققين بذلك فكرة ال ×ع ل٥1‏ 1٥ء[‏ 1)ااص] وهناك طريقة فهرسه مشهورة تسى ( 
]ndex>ed Sequential Access Method ) ISAM‏ تعتمد على هذه الطريقة. 


- :Types of Single — level Ordered Index 
فكرة الفهرس المرتب تشبه تماما فكرة الفهرس بنهاية الكتب حيث نجد المصطلحات الواردة في الكتاب مرتبة‎ 
حسب الحروف الهجائية مع رقم الصفحة لكل مصطلح . وفي حالة عدم وجود الفهرس بالكتاب نضطر للبحث‎ 
1inع2۲‎ ؟ع2۲٥1 في كل كلمات الكتاب حتى نصل إلى المصطلح المطلوب وهذه العملية مثل البحث الخطي‎ 
. في الملف‎ 
11d يحتوي الملف على عدة حقول » يْوَ ّف الفهرس على حقل واحد فقط ويسمى حقل الفهرسة 11£×ع‎ 
› الفهرس نفسه عبارة عن هیکل بیانات (یمکن ان یکون ملف ) تخزن به أي قيم‎ » 1d or attribute 
للكتل وkعهآط ءال التي تحوي سجلات لها قيمة حقل الفهرسة‎ م0١1١)‎ ٥١١ حقل الفهرسة معه مؤشرات‎ 


القيم بالفهرس مرتبه (قيم حقل الفهرسة) › وحجم الفهرس نفسه اقل بكثير من حجم ملف البيانات ولهذين 
السببين يمكن استعمال البحث التنائي 8٥2۲٥1‏ 0113۲۷ في الفهرس . 
هناك عدة أنواع من الفهارس المرتبة وهي : 
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1. Primary index. 
2. Clustering index. 


3.secondary index. 


: Primary index.1 


هو عبارة عن ملف مرتب مكون من حقلين : 
الاول من نفس نوع بيانات المفتاح الاساسي لملف البيانات e‏ ]1اگ data‏ وو primary key Ji‏ . 
الثاني هو المؤشر ١١01م‏ والذي يؤشر إلى .(disk block (block address‏ 
ولهذا فهناك سجل واحد فقط »1۲7۷ع ×11 في ملف الفهرس مقابل كل كتلة )10ط من ملف البيانات 
أي سجل في الفهرس ل۲٤1٥‏ ×11 يحوي بحقل المفتاح الاساسي قيمة حقل البحث لاول سجل بالكتلة 
التي يؤشر لها » ومؤشر لتلك الكتلة )1ط وهو عبارة عن عنوان هذا ال )10ط . وفيما يلي نرمز 
لسجل الفهرس (ر۲٤٣ع ٥×‏ ل,1(1) (1 كالآتي : 
(k (i), p (i)‏ ( 
الشكل رقم (13) يوضح مثالا لفهرس أولى ×عل11 ۲10317م بإعتبار ان حقل الاسم 12008 هو المفتاح 
الاولى إع) ۲12۲م لملف البيانات وبفرض ان الاسم لايتكرر 111418 ٠»‏ تم اختيار الاسم ليكون هو 
key‏ r]maryم‏ للفھرس 
11 بالفهرس قيمة الاسم والمؤشر لكل كتلة » وكمتال لاول ثلاث سجلات في الفهرس ٥۸٤۲۷‏ ×1۸ 
k (1)= (Aaron , Ed) , p (1) = address of block 1‏ 
k (2) = (Adams , John) , p (2) = address of block 2‏ 
k (3) = (Alexander ,Ed ), p (3) = address of blocks 3‏ 
الشكل رقم (13 ) يوضح هذا الفهرس وبيانات الملف » عدد السجلات بالفهرس يساوي عدد الكثل بالملف . 
السجل الأول باي كتلة يسمى السجل الخط افي للكتلة او anchor 1ec01d‏ 
.ەل او كثيفه 804۲58 الفهارس يمكن تصنيفها الى خفيفه 
Dense [nd ex)‏ : لها سجل e۸۲۷‏ ×ع ل١1‏ لكل سجل في ملف البيانات . 


Sparse Index‏ : وايضاً تسمي ×11 n0n dense‏ وھي لھا سجل 1۸de× ٥۸٤۲۷‏ واحد فقط 
لبعض السجلات في ملف البيانات » وبهذا فال ×ع 11 2٣‏ ]ام هو من هذا النوع لان لها ×عإہ1 
ent‏ لكل )اطا في ملف البيانات . 
ملف الفهرس يكون حجمه اقل بكثير من حجم ملف البيانات وذلك لسببين :- 
1.عدد ال كع ent]‏ xع1nd‏ به أقل من عدد السجلات بملف البيانات . 
2حجم ال ۲اطع ×ع لم1 أقل من حجم السجل في ملف البيانات لان به فقط حقلين هما المفتاح 
والمؤشر . 

ولهذا فان ملف الفهرس يمكن ان يخزن في عدد بسيط من الكتل ك)عهآط )ءال مقارنة بعدد الكتل لملف 
البيانات وبهذا تكون عملية البحث الثنائي في ملف الفهرس اكثر كفاءة لان حجمه صغير . 
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البحث في .— primary Index‏ :- 
السجل الذي يكون مفتاحه الأساسي يساوي K‏ يقع في الكتلة )1ط والذي عنوانه 1) ) حيث 
)k )1( > kK > kK )1 +1‏ والكتله رقم 1 تضم بملف البيانات كل السجلات التي تكون قيمة مفتاحها قريبه 
من ال وبهذا نسبة للترتيب الحقيقي للملف ع0۲ إhysicaم‏ . 
وللوصول الى السجل بمعلومية القيمة ‏ بحقل المفتاح نقوم بالبحث الثنائي 1٥4۲ع‏ 01131۷ في ملف 
الفهرس نجد ال (لارء ×علم1 (1 المناسب وبالتالي نصل إلى الكتلة )٥1ط‏ ءال والتي عنوانها 
(Pû‏ . 
مثال رقم (1) : 
افترض أن لدینا ملف مرتب مکوّن من عدد 30,000= ۲ سجل مخزن في قرص حجم ال )10ط به 
يساوي y†eا8=1024‏ . السجلات به من النوع 4عa11مUns xed Size&‏ وطول السجل 
R=100 byte‏ . 
ال actor‏ 0ckingاb‏ تساوي: 
bfr = (B/R) = 1024 / 100 = 10 Record/block‏ 
عدد الکتل عاط التي تكفي الملف: 
B=[ r /bfr ] = [ 30,000/10 |] =3000 blocks‏ 
البحث الثنائي في ملف البيانات يحتاج ل 
log2 b | = [| log2 3000 ] = 12 block access‏ [ 
والآن نقوم بالحساب اذا استعملنا الفهرس › فبفرض أن حقل الترتيب حجمه ك)لإط ۷=9 › المؤشر حجمه 
6 6 = م وقمنا بإنشاء فهرس للملف تكون تفاصيله كالاتي :- 
index entry Ri = 9 + 6 = 15 byte‏ 
وبهذا يكون ال 0۲اءه؟ چمن)ءه‌اا يساوي : 
bfr=1025/15=68 eateries/block‏ 
والعدد الكلي لل كعاإعامء عل يساوي عدد ال كعه1ط بملف البيانات وهو يساوي 3000 = ٣‏ 
1 عدد ال وعه[ط التي نحتاجها: 


b= | r; / bfrı |= 3000 /68 = 45 block 

ولكي نقوم بالبحث الثنائي في هذا الفهرس نحتاج ل : 
log2 bi |] =| log2 45 | = 6 block access ]‏ 
اضافة لل )10ط الذي يحتوي على البيانات نفسها . 
العدد الكلي 7 6+1 -=block accesses‏ 
تم تحسين النتيجة من 12 الى 7 . 
المشكلة الأساسية في ال ×ع لطا إ2۲ ٣1م‏ هي مشكلة كل الملفات المرتبه وهي مشكلة إدخال وحذف 
سجل » وهنا المشكلة مركبه حيث يظهر اثرها على : 

#ملف البيانات حيث تحرك البيانات » للمحافظه على الترتيب بعد عملية الحذف أو الاضافه . 
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#ملف الفهرس حيث تدخل ٥11108‏ جديدة ويعدل الفهرس بما يتوافق مع البيانات المدخله او المحذوفه . 
ايضا تحل هذه المشاكل بإستعمال ملف الفيضان linked list of over flow Jlnعتul gl over fl0w‏ 
reco‏ لأي )ع1ا في ملف البيانات . وحذف البيانات باستعماJ deletion marker —.I‏ . 


J 


CAT, FILÊ 


ciqure i, Primary ines on rhe Orble iu xey hela ج ب‎ 


Figure (13): Primary Index on the ordering key field of the file 


: clustering Index (2) 


ف ع و yااsicaرhم‏ على اساس حقل غير مفتاحي non key fie|d‏ 
والذي لیس له قيمه فريده لاي سجل « ويسمى هذا الحتJ clustering field‏ . 
یمکن ان ننشئ نوع جدید من الفهارس یسمی 11٥×‏ 8١۲1٥)ءلاآء‏ ليتوافق مع هذا النوع . 
هذا النوع يختلف عن ال × ل٣[‏ ۲٣۲1م‏ بانه ليس له قيمه فريده 110118 لكل سجل بملف البيانات 
ال 1nd e×‏ usteringاc‏ ھو ملف مرتب مکون من حقلین : 
* الاول : من نفس نوعية بيانات ال 14ع 4١۲1ع)كuآاء‏ بملف البيانات . 
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* الثاني : مؤشر rعpo1nt block‏ 
وهناك مدخل واحد (سجل واحد) ۲7٤1ع‏ 018 في الفهرس لكل قيمه منفصلة ع۷2 ٤٥1۸ء1‏ لحقل 
ed‏ usteringاc‏ ویحتوي علي :- 


1.القيمة 
2مؤشر لاول )٥10ط‏ في الملف يحوي هذه القيمة في حقل |Jئ— clustering field‏ 


الشكل رقم (14) يوضح مڻاJ clustering i¬dex J‏ . 
نلاحظ أن الملف هنا أيضا فيزيائياً مرتب ااهء رطم وبهذا فهو يعاني من مشاكل الحذف والإدخال 


ولكن لتلافى مشكلة الإدخال نخصص مجموعة من ال ء)عهآظط ار ۲إعاوuآء‏ لكل قيمه جديده ال 
fed‏ ringعustاc‏ أي لانبدأً القيمة الجديدة لل 14ع ع١ااعtاusاc‏ الا في كتله (Kء10ط‏ ) جديد وهذا 


entry Jiدم لان له‎ « parse or non dense 11dex J هو مثال جدید‎ clustering index I 


في الفهرس لكل قيمة وحيدة ۷211٥‏ ٥10ئ1‏ في ملف البيانات (بدلا عن لكل سجل من ملف البيانات 


( primary Index —JI كما في‎ 


or ATE NEE 
En a: LF DAE _ ا‎ 
ي‎ eT 1 1 
EE 7 او‎ 
1 1 آ چ‎ 
ا ا‎ 
جا ےا ا‎ 
س ے‎ as ع‎ 1 
ج نے وا‎ ۱ 1 
س‎ 1 E 
سے ا‎ e ن‎ 
EE آ کے سے ر‎ 
Sa کی ےا ا‎ 
ی ی‎ aa ا‎ 
1 ١ أ ا ج ا‎ 
E ES 1 اش کے‎ 
و کے ا‎ 
|NDEX FILE : e س‎ 
i THT nire ر‎ 1 
i Pilz emre 1 ي ا‎ 
aa 7 ج س ا ل ر‎ 
ا ی ر ا‎ 
اجج و ن | | ا ا‎ ۱ 
eT 0 ر‎ e ا‎ 
FELE VALET “| E أ‎ e 2 سے__ | ا أ‎ 
د أ ا نے بے‎ 
٣ 1 5 2 1 1 ا‎ 
1 2 1 س او‎ 
a MM آ‎ 4 e ا‎ 
| ھا س بي ي‎ e ی کے ےک‎ 
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Figure(14) :A clustering index on the DeptNumber ordering non key field 
of an Employee File 
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secondary Index (3)‏ : 
هو أيضاً ملف مرتب من حقلين: 
الاول : حقل فهرسة 14ع ٥×1١g‏ 114 هو من نفس نوع بيانات أحد الحقول بملف البيانات غير الحقل 
الترتيبي بlلaلک non ordering field of the date fle‏ . 
الثاني : مؤشر record pointer Jجul gl block pointer ةlتSÛ al‏ . 
يمكن أن يكون لملف البيانات الواحد عدة فهارس انويa4 many secondary 11dexes‏ . 
ويمكن أن ينشا فهرس ثانوي ×14[ 6٥014317‏ على حقل مفتاحي 14ع ره) والذي له قیمه فریده 
Dstinct value‏ لکل سجل بالملف. 
وفي هذه الحالة يسمى الحقل day Ky‏ 0nععء‏ .. و في هذه الحالة فهناك سجل فهرس 1۲ع ×ع 11d‏ 
لكل سجل بيانات في ملف البيانات . ويتكون هذا ال ٥٣٤٣۷‏ ×1۴[ من حقلين: 
الأوJل: secondary key‏ 
والثاني: مؤشر للكتلة )0[ التي يوجد بها هذا السجل او للسجل نفسه وبالتالي فهو ×عل11¡ Dense‏ . 
مرة اخری نرمز لمكونات سجل الفهرس ۲۷٤1ع ٥×‏ 114 بالزوج > < (1) مط ,  )1(‏ وسجلات الفهرس 
هذه مرتبه حسب قيمة ال 1) )) حيث يمكن إجراء بحث ثنائي 81٣32۲¥ S٥4۲٥‏ عليها . 
ولان السجلات بملف البيانات ليست مر تبه secondary key JI mw. not physically 01der‏ 
فلايمكن أن نستعمل ١10۲ع١ه‏ )1ط بل يجب أن هناك مؤشر لكل سجل في ملف البيانات (وليس لكل 
boc)‏ كما في ال primary index)‏ . الشكل رقم ) 16 |( ڍgڂضz secondary i1dex‏ 
والذي به المؤشرات هي ١٥٣01م‏ )1ط ( نلاحظ ان هناك مؤشر لكل سجل في ملف البيانات ولكن هذا 
المؤشر يؤشر لل ءه1ط الذي يحوي هذا السجل ). 
وعند الوصول لل )10ط ونقله للذاكرة يتم البحث عن السجل المطلوب هناك . 
الفهرس الثانوي ٥×‏ ل11 yا2‏ ل0ك يحتاج لمساحة تخزينية أكبر وزمن البحث فيه اطول مقارنة 
بالفهرس الاولي ×ع ل11 p۲1173۲7‏ وهذا لان عدد المدخلات ٥1٣1٥8‏ فيه اكبر . 
ولكن وكما سنوضح في المثال التالي يكون التحسن في البحث كبوا جد عند استعمال ال second 21y‏ 
×ع ل11 والمقارنة التالية توضح ذلك . 
مثال رقم (2) : 
بالرجوع للملف في مثال رقم (1): 
0 = 1 - 
Record size R = 100 byte block size B = 1024‏ - 
Number of blocks needed b = 3000 block‏ - 


#عند اجراء بحث خطي ۸١4۲ع 111٥82۲‏ (لان الملف غير مرتب ) نحتاج 
b/2=3000/2 = 1500 block accesses‏ 
uleتعJln V= q non ordering key « Pointer s1ze pج+> ils, secondary index‏ 
p = b bytes‏ 
entry size = (9 +6 ) = 15 byte‏ 0 
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- bfr = | (B/R:; ا‎ = 1024/15 = 68 entries per block 
r1) index entries) إِذن يکون عدد‎ » dense وحيث ان الفهرس من النوع الكثیف ×ع ل11‎ 
]1 = 30,000 يساوي عدد السجلات بملف البيانات‎ 
1١d يكون عدد ال ك)عه1ط التي نحتاجها لتخزين ال ×ع‎ ١ 
bi = [(ri/ bfri ) |=Î (30,000 / 68 ) |= 442 blocks 
وباستعمال البحث الثنائي على هذا الفهرس نحتاج ل:‎ 
log2 bi = log2 442 =9 block access 
اضافة لكتلة )عه[ط من ملف البيانات نفسه المحتوية على السجل فيكون العدد الكلي‎ 
secondary 11dex JInعتwl‎ jgدڊ‎ 1500 مقارنة ب‎ block access 9+1 = 10 


)1( جدول رقم‎ 
Non orderinege field Ordering Field 


8 pe 
(Secondary index (non key | Primary index Key field 


(Secondary index (non key | Clustering index Non key field 


)2( جدول رقم‎ 
Block Dense or Number of (first level ) | Type of 
anchoring on | Non index entries index 
Data file Dense 
Yes Non dense Number of blocks in Primary 
date file 
Yes/ no(1) Non dense Number of distinct Clustering 
index field values 
No Number of records in 
data field (key) 
No Dense or Number of record (2) or | Secondary( 
Non dense Number of distinct non key 
Index field values(3) 


Property indexes types : 

1- yes : if every distinct value of the ordering field starts anew block . 
no : other wise 

2- option 1 

3- options 2 and 3 
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Figure(16): A dense secondary index (with block pointers) on a non 
ordering key field of a file 
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